重磅!希尔贝壳参与编制的《2023人工智能基础数据服务产业发展白皮书》正式发布

2023年,以ChatGPT为代表的大模型技术相继落地,有力地推动了人工智能等前沿技术的突破和应用,为数字经济发展打开新思路。数据作为大模型发展的重要基础,迎来新机遇。8月24日,国家工业信息安全发展研究中心发布了《2023人工智能基础数据服务产业发展白皮书》(以下简称“白皮书”),希尔贝壳为主要参编单位。

 

 

本白皮书是继去年发布《2022人工智能基础数据服务产业发展白皮书》后,国家工业信息安全发展研究中心通过建立常态化研究机制,持续动态跟踪我国人工智能基础数据服务产业发展进程,并联合17家人工智能基础数据服务企业、科研机构和相关单位共同撰写而成。

白皮书梳理了人工智能基础数据服务的概念内涵,介绍了大模型不断突破下产业发展面临的新背景和具备的现实意义,系统分析了产业的发展现状、发展环境和典型服务场景,详细探究了产业未来发展趋势及面临的挑战,并提出了相应的举措建议,旨在为各界展现我国人工智能基础数据服务产业发展全貌,为产业发展提供新思路。

白皮书指出,人工智能基础数据服务产业是人工智能产业的重要支撑,为人工智能提供重要的数据“燃料”。随着人工智能技术的日益成熟和普及,特别是近年来基于大模型的生成式人工智能技术不断取得的突破,高质量数据需求保持了迅猛增长态势。发展人工智能基础数据服务产业能够助力构建人工智能产业生态,广泛促进就业,带动地方商业经济快速发展,具备良好的产业生态效应及经济社会效益。在全球人工智能产业保持高速增长的态势下,人工智能基础数据服务产业已进入技术创新密集活跃、产品应用深度拓展的发展机遇期。

白皮书认为,生成式大模型等颠覆技术的发展和衍生应用背景下,人工智能基础数据服务产业规模快速增长,并逐步进入到注重技术能力的专业化发展阶段。产业链日趋完善,呈现百家争鸣的竞争态势,中小型数据商同质竞争激烈,品牌数据服务商技术、人才优势明显。同时,大模型的快速发展使得数据服务需求激增,产品整体处于供不应求状态。对话式数据集成为当下需求热点,定制化服务占据市场需求主流。企业间竞争正由价格渠道竞争,向包括技术、管理、资金在内的综合能力竞争转变,行业门槛提高。互联网科技巨头和专业品牌数据服务商占据市场竞争优势,中小型数据服务商的利润空间被进一步挤压,市场出清加速。从场景布局来看,自动驾驶是当前最重要数据服务场景。从区域布局来看,产业基地集中于山西、山东等人口大省,产业研发中心则在北京、上海等一线城市聚集,呈现分化集中的特点。

当前,我国人工智能基础数据服务产业的发展环境持续向好,产业政策逐步完善,行业技术水平不断提升,人才发展生态持续优化,标准建设布局明显加快,资本市场日趋活跃。在不断优化的产业发展环境下,人工智能基础数据服务产业发展呈现以下发展趋势:一是高质量数据集将成为重要发展方向,国内优质数据集仍然较为稀缺,专业化、高质量数据集建设亟待加强。二是合成数据将在大模型带动下成为产业发展新赛道。受多样化不足和长尾化效应影响,大模型训练数据面临耗尽的问题。算法生成的合成数据有望弥补不足,成为数据服务新赛道。三是大模型将助力智能化服务模式快速落地,有力提升数据服务效率。四是数据服务人才将加速向高端化发展,复合化、专业化人才将成为行业主力。五是数据合规、隐私保护、价值观对齐等安全问题将进一步成为产业关注重点。

白皮书提出,目前我国人工智能基础数据服务产业在快速发展同时,也面临着人才培养不足、标准体系亟待健全、数据安全风险凸显等挑战,需要从技术、产品、标准、人才、安全、公共基础设施等方面着手,进一步推动我国人工智能基础数据服务产业持续健康发展。一是加快构建高质量数据集。二是研发数据服务质量评测标准。三是加强技术研发,发挥集约化、自动化数据服务工具优势。四是提升专业人才供给,带动劳动密集型业态转型升级。五是加大行业安全监管,优化数据服务安全环境。六是完善公共基础服务,健全产业支撑体系,营造互利共生、协同共进的产业生态。

 

 

 

希尔贝壳,以人工智能民主化为目标