【资料图】
8月24日,在第二届云冈数字新基建发展论坛上,国家工业信息安全发展研究中心发布《2023人工智能基础数据服务产业发展白皮书》(以下简称《白皮书》)。国家工业信息安全发展研究中心副主任李丽解读了《白皮书》内容,《白皮书》共分五部分,分别是人工智能基础数据服务产业发展的背景、现状、环境、趋势和建议。
《白皮书》中提到,人工智能基础数据服务产业为人工智能提供重要的数据“燃料”。以 ChatGPT 为代表的人工智能大模型技术的跨越发展,加速推动人工智能产业升级和融合应用。人工智能大模型的发展建立在对更大规模和更高质量的基础数据采集、处理、分析基础之上。
人工智能基础数据是指可用于人工智能模型训练、校验应用的数据,包括视频、图像、图片、语音和文字等。人工智能基础数据服务是指为满足人工智能算法研发,提供的包括数据库设计、数据采集、清洗、标注和质检等在内的一系列数据服务,以数据采集、标注为主。其中,数据采集是人工智能基础数据服务的“第一步”。采集到的原始非结构化数据经过清洗、标注后,才能被用于算法训练。
《白皮书》分析,人工智能基础数据服务产业能够广泛促进就业。以数据标注为例,标注人员只需对文本、语音、图像、视频等做简单标记即可,约 70%的业务领域从业人员仅需要高职、大专学历,经过简单培训便可上岗。发展人工智能基础数据务产业可以助力传统从业者转型,迅速吸纳当地就业人员帮助地方解决就业问题。数据标注基地、产业园平均解决当地就业规模在 2000人左右,对地方就业空间的拓展作用日益凸显。
《白皮书》提到,人工智能基础数据服务产业可以助力地方构建人工智能产业生态,是产业链基础层的重要环节,以人工智能基础教据服务产业为抓手,一方面可以对人工智能算法研发企业产生向心力,吸引人工智能产业上下游企业不断集聚;另一方面可以拓展当地人工智能基础数据服务产业链条,从而帮助地方构建完善的“基础数据+智能应用”产业生态,推动产业优化升级。