山西数据交易平台半年成绩单 赞!
2021-12-01
山西数据交易平台

       3月28日,记者从山西综改示范区了解到,省内首个数据交易平台——“山西数据交易平台”经过半年多试运营,已引入数据服务供应商超1100家,累计完成交易额超5000万元。


  国内最大单体数据标注基地

       在百度山西数据标注基地一间间的办公室中,每台电脑前都坐着一名AI数据标注师,他们将根据各自领到的任务对图像、语音、视频、文本进行标注。比如,在采集大量的人脸数据后,AI数据标注师会对人像进行标注,提取特征,对人脸的眉毛、眼睛、颧骨等关键点进行精准标注,标注的特征点越多,AI就越能精确地识别。同时,将特征“喂”给人工智能模型,模型总结之前人工标注出的信息进行计算,并找出通用规律,这时,这个人工智能模型就具备了人脑才有的认知和判断能力。

  AI数据标注师的工作就是教会AI认识数据,有了足够多、足够准确的数据,AI才能像人一样去感知、思考和决策,从而更好地为人类服务。特殊时期,百度山西数据标注基地为多个“科技防疫”项目的实施应用提供了支撑。例如,完成对戴口罩的人脸图像的标注,让人们在不摘口罩的情况下,也能实现精确体温监测或是通过人脸闸机。

  目前,百度山西数据标注基地已成为国内人员和产值规模最大的单体数据标注基地,全面覆盖无人驾驶、语音识别、人脸识别、内容审核等30余种数据标注场景。

  伴随着越来越多人工智能场景的应用,获取海量结构化数据已成为人工智能企业实现技术突破的关键。据测算,作为人工智能产业的基础产业和重要环节,数据标注的市场规模到2022年将达到300亿元。

  百度宣布未来5年,将在百度山西数据标注基地培养5万名AI数据标注师,并引入更多AI合作伙伴。

  构建数据融合生态

  2017年7月11日,山西省政府与百度在线网络技术(北京)有限公司签署了《战略合作框架协议》。根据协议内容,双方将依托山西现有政策资源和产业基础,充分发挥百度公司人工智能、大数据、云计算等技术优势,开展全方位、深层次战略合作,为山西经济发展、产业升级、城市管理和科技创新提供支撑。

  以数据标注产业为切入口,百度山西数据标注基地着力构建集数据采集、清洗、标注、交易、应用为一体的基础数据服务体系,加快大数据产业发展。

  2020年7月,山西综改示范区与百度公司共建的“山西数据交易平台”正式上线。该平台以AI数据为特色,依托百度AI、大数据、安全计算等产品技术与生态资源能力,以建设成为全国最大AI数据交易中心为目标,以构建数据融合生态,培育山西数据要素流通市场为使命,面向山西乃至全国的数据供求方,提供集数据采集、清洗、标注、交易、应用等为一体的全栈式数据服务,并已在交易服务、技术创新、资源建设、交易合规方面形成四大核心能力。截至目前,该平台已引入数据服务供应商超1100家;经过数据脱敏,上线AI数据集169个,接入API数据接口147个,总数据量超1.3亿条,涵盖语音识别、文字识别、人脸识别、自动驾驶、自然语言处理等多种数据场景;平台自上线以来,累计完成交易额超5000万元。

  在交易服务方面,平台构建了涵盖业务咨询、方案定制、资源协调、项目管控、售后服务等全流程的服务能力;在功能创新方面,平台内嵌AI数据可视化管理、智能驾驶标注数据自动清洗等特色功能;在资源建设方面,平台引入多行业、多场景AI数据资源,并整合政务、企业、社会等多类型数据资源;在交易合规方面,平台结合现行法律法规及行业规范,制订实施数据安全等级管理、交易流程安全管理等策略,保障数据交易安全合规。

  未来,平台将依托基地的数据服务能力支撑,进一步整合数据服务产业资源,引入数据生态企业,打通数据服务产业链,积极探索融合区块链、多方安全计算(MPC)、可信执行环境(TEE)等前沿技术,提供完善的数据登记、数据安全、数据融合等解决方案,打造“使用即交易”全新模式,促进综改示范区形成大数据产业新生态,助推高质量高速度发展。(来源:山西青年报)