新基建浪潮下,作为AI原油的数据产业蓬勃生长,也催生出对“数据标注师”这一新职业的大量需求,促进就业。7月2日消息,作为全球领先的AI平台型公司,百度宣布将继续加大对新基建数据产业方面的投入,未来5年将在百度山西数据标注基地培养5万名AI数据标注师,并引入更多AI合作伙伴。百度与山西数据标注基地的合作模式,未来还将拓展到更多省市,提供更多的AI就业岗位,支持当地科技产业发展。为了了解数据标注产业和“数据标注师”这一新兴职业,记者探访了百度(山西)人工智能基础数据产业基地(以下简称百度山西数据标注基地)。
“保就业”“稳民生”,数据标注提供大量岗位。
在基地里,数据标注师正坐在电脑前熟练标注肺部影像上的病毒数据,以提高人工智能对病毒的识别能力。疫情发生以来,他们已标注了数千张这样的肺炎影像图。“平常医生看一张CT需要几分钟的时间,如果用我们参与标注的人工智能算法作为辅助手段,几秒钟就能初步判断一张CT上是否存在疑似病毒。”医疗影像项目小组长秦美介绍。
据了解,AI数据标注师是随着人工智能的发展出现的一个新兴就业岗位。2020年2月,“人工智能训练师”正式成为新职业并纳入国家职业分类目录。数据采集和标注是人工智能训练师的主要任务之一。数据标注师的工作是教会AI认识数据,有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。
疫情期间山西数据标注基地还完成了戴口罩的人脸图像标注,采集大量的戴口罩的人脸照片后,数据标注师对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准的标注,标注的特征点越多,AI就越能精确地识别戴口罩场景下的人脸,让人们在不摘口罩的情况下也能实现精确的体温测量,或是通过人脸闸机。
疫情发生后,百度公司积极参与科技防疫,山西数据标注基地功不可没。今年2月3日以来,基于百度的云上标注和远程办公,基地1300多人线上复工,为全国各地多个“科技防疫”项目的实施应用提供了重要支撑,实现产值近2000万元。
在数据标注的支持下,百度AI多人测温已在全国近百处公共场所落地部署,落地两个月内就累计检测2700万人次;百度智能外呼平台已在北京海淀区、陕西西安、上海宝山等十几个地区投入使用,支持流动人员排查、本地居民排查回访、特定人群通知三大场景的外呼服务;百度阿波罗携手新石器推出的无人智能防疫车,已在武汉、上海、深圳和广州等地的重点保护区域和隔离区域进行消杀作业。
疫情之下,“保就业”成为中央及地方政府工作的重中之重。今年的两会政府工作报告,39次提及就业,较去年的22次大幅增加。数据标注正是促进就业的一大新兴职业,其技术门槛低,经过一定的培训就能上岗,招工人群范围广泛。而且,数据标注只需要员工有电脑就可以在家办公,不容易受到疫情的影响,使得员工的收入更加稳定,抗风险能力提升。
郭梅“再就业”的经历便是一个生动注脚。例如,34岁的郭梅原本就职于山西的传统矿业单位,来到山西数据标注基地,经过公司的岗前培训和团队的帮助,一开始每天只能标注两三百张,现在提升到每天能完成1300多张,实现了从传统行业到新兴行业的职业转型。作为数据标注师,她的收入也高于当地平均收入水平。
(数据标注师郭梅)
一年半后,郭梅已经掌握了无人驾驶,人脸识别,图像分类,语音识别等数据标注的能力。作为一位7岁孩子的母亲,她对丢失儿童的家庭的悲凉感同身受,她开始理解人脸数据标注这份工作的意义,在百度AI寻人帮助1万个家庭破镜重圆的故事中,也有自己贡献的一份力。
“这份工作让我觉得可以跟上世界的脚步,距离未来不再那么遥远。”郭梅谈到。
百度数据标注基地落地山西以来,一直肩负“保就业”“稳民生”的企业社会责任,不断创造新型就业机会,为高职大专毕业学生、部分残障人士、下岗再就业人士等提供就业岗位。百度还宣布将在5年内为山西提供5万数据标注师就业岗位。
基地约有九成的人员为“00后”的高职大专毕业学生,由各标注企业从院校合作招聘过来,部分院校和标注企业形成了校内培训加分配就业的合作,实现了教育链和产业链的有机衔接;另外约一成标注人员来源于社会招聘,包括部分残障人士和下岗再就业员工。目前基地标注人员的收入水平已经高于山西省的平均收入水平。
AI新基建助力煤炭大省向数字经济转型升级
今年全国两会,备受关注的“新基建”首次写入政府工作报告。新基建之新,就在于其是提供数字转型、智能升级、融合创新等服务的基础设施体系,涵盖物联网、5G、人工智能等方方面面。而这些技术都离不开数据标注。
所谓“数据标注”就是借助标记工具,对数据进行加工,去教会机器识别数据。人工智能的三要素中,数据作为基础,比算力和算法还要重要。数据标注可以说是人工智能的动力和灵魂。
山西是名副其实的煤炭大省,然而,“一煤独大”格局也成为山西之痛。近年来,山西不断发展清洁燃煤技术,并探索打造具有山西特色的数字经济新高地。百度山西数据标注基地正是山西转型综改示范区的重要项目。
目前,数据标注基地业务全方位覆盖了无人车、语音、人脸、图像、NLP、地图测绘等数据类型的标注和加工处理服务,成为建立新兴人工智能基础设施的底层支撑,加速智能交通、智能地图、智慧医疗、智慧城市等领域的智能化升级速度。
从签约至今,百度已经帮助山西从全国各地引入35家国内优秀的数据标注企业,通过导入百度自有的数据标注业务,为人员提供业务培训,帮助标注企业实现营业收入近亿元。百度二期办公场所投入使用以来,办公规模扩大了3倍,从业人员达到2000余人,成为全国范围内人员和产值规模最大的单体数据标注基地。
山西省政府为了支持数据标注产业的发展,陆续颁布了《山西省数据标注产业发展规划(2019-2025年)》《 山西省加快数据标注产业发展的实施意见》和《山西人工智能基础数据产业专项资金管理办法》,为入驻山西转型综改示范区的标注企业提供了一系列的扶持配套政策。
2019年12月2日,山西省委书记楼阳生在参观山西(百度)数字标注产业基地时指出,建设数字山西,是推进治理体系和治理能力现代化的必然选择、必由之路,他希望百度加强与山西的合作,拓宽应用服务领域,为建设数字山西、打造数字政府作贡献。
2020年6月6日,百度智能云数据众包与山西省政府达成合作协议。双方将进一步深化合作,加快推进山西省重大转型项目建设,共同打造山西综改示范区AI数据交易平台。
山西数据交易平台的建立,将不断扩展百度在山西的业务,帮助山西省数据服务类企业扩大经营范围,促进数据资源的开放与共享;同时,百度正在牵头制定数据标注的地方标准,将进一步标准化省内各项数据服务业务,提高山西在全国范围内的影响力,推动山西数字经济转型。
百度智能云数据众包高速增长
据艾瑞咨询《2019年中国人工智能基础数据服务行业研究报告》显示,凭借着较早的布局和投入,百度智能云数据众包实现了市场占有率和营收规模业界第一,2019年业务年度增长率超50%。自2011年起,百度智能云数据众包就全面支持百度自动驾驶、小度助手等AI业务。经过十年沉淀和打磨百度智能云已经建立起采标能力业界第一、流程标准化工具智能化、全流程管控确保数据安全的一站式AI数据服务平台,全面涵盖了包括智能驾驶、手机行业、互联网和AI开发者四大领域的全部头部客户,成为国内最大的AI数据服务提供者。
例如,采标能力方面,百度智能云数据众包建立起了业界第一的海量人工智能基础数据采标能力。通过自建山西标注基地,拥有超过2000名专业全职标注人员;构建了遍布全国乃至全球22个国家渠道代理资源池,拥有超过5万名线下采集员;超过2000万名的众包互联网用户,随时响应各类数据采标需求,满足市场95%标注场景需求。
新基建给人工智能产业相关领域的发展带来了前所未有的机遇,提前布局且有着完善生态建设的百度智能云不仅带动了AI数据服务行业的高质量发展,更积极履行了企业的社会责任,为各行各业智能化转型提供动能,加速智能经济到来。(来源:Yesky天极新闻)