工信部:中国已成为全球开源参与者数量增长速度最快的国家

 

近年来,中国在开源领域取得了令人瞩目的成就。工信部数据显示,中国已成为全球开源参与者数量增长速度最快的国家。在这个蓬勃发展的开源大潮中,希尔贝壳公司作为一家致力于技术创新与产业融合的企业,积极投身于开源生态建设,为中国开源事业的发展贡献着自己的力量。

AISHELL自2017年以来一直致力于相关工作,开源内容主要围绕数据集、技术方案和论文,具体如下:

 语音识别数据集:开源AISHELL - 1(170小时数据),开源AISHELL - 2(1000小时数据),开源Wenetspeech(10000小时数据)等。

• 语音唤醒数据集:开源HI - MIA数据集,覆盖家居近远讲环境;开源HI - MIA - CW唤醒词负样例数据集。

 语音合成数据集:开源AISHELL - 3。

• 特定场景数据集:开源AISHELL - 4(会议场景),开源DMASH(麦克风阵列家居场景),开源AISHELL - 5(智能座舱中文语音交互)。

• 特殊语音数据集:开源AISHELL - 6A(中文口吃语音)、AISHELL - 6B(中文构音障碍语音)。

• 语音增强数据集:开源AISHELL - RealMAN(中文复杂场景语音增强)。

每次开源同时伴随技术方案和论文,更多信息可访问官网平台:https://www.aishelltech.com/

 

北京希尔贝壳科技有限公司是一家专注人工智能数据服务和辅助模型训练的创新公司。拥有行业领先的数据工程技术,针对人工智能大模型所必须的高质量数据提供精准的数据集、数据采集、标注、清洗、合成等方案。聚焦智能家居、智能座舱、机器人等人机交互场景做语音、文本、多模态数据服务。希尔贝壳在模型评测、AI辅助标注、AI数据工程、数据处理平台、高质量数据集等建立了领先的核心技术体系。

 

希尔贝壳技术团队均来自人工智能、大模型、数据科学领域,在音视频高质量数据集的建设已经达到了国际领先水平,部分数据集已成为产学研的标准。拥有50多项知识产权,希尔贝壳与清华大学、中国科学技术大学、西北工业大学、南开大学等重点实验室共同建立科研平台,并联合发表多篇顶级论文。希尔贝壳是国家高新技术企业、中关村高新技术企业、北京市专精特新企业、北京市新技术新产品企业。公司获得ISO 27701、ISO 27001、ISO 90001等信息安全管理、隐私信息管理、质量管理的认证。

希尔贝壳深耕AI数据服务领域多年,拥有专业的数据工程团队和强大的数据采集、处理能力,在数据采集和AI+专家标注方面具备丰富的实践经验。希尔贝壳服务了全球顶级AI科技公司与科研机构1000余家,建立了良好的合作生态,不断扩大合作关系。公司致力于人工智能民主化,以数据驱动人工智能技术落地。

希尔贝壳,以人工智能民主化为目标