2020年中国面向人工智能“新基建”的知识图谱行业概述

2020-12-16

新型基础设施建设是为加快国家规划建设推出的重大工程和基础设施建设项目,面向新产业、新业态和新模式,同时助力传统基础设施的智能化改造。新基建三大规划领域中,两大领域都直接提及人工智能。新基建背景下,人工智能将迎来新一轮快速发展。


当前人工智能的发展仍然处于弱人工智能的状态,研究重心由感知智能过渡到认知智能。知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的大规模语义网络,帮助机器实现理解、解释和推理的能力,是认知智能的底层支撑。


2019年知识图谱相关的融资金额较2018年增长超过200%,逐渐成为人工智能又一热点产业,产业链已初具规模,2019年知识图谱核心产品市场规模约65亿元,知识图谱技术带动经济增长规模约391.8亿元。


   新基建的内涵和外延

发力于科技端的信息数字化基础设施建设

2020年4月20日,国家发改委将新型基础设施初步定义为:以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系。

与传统的基础设施建设相比,新基建体现出“重创新、补短板”的特征:主要面向新产业、新业态和新模式,促进经济结构优化;但同时也对传统基础设施建设形成补充,助力传统基础设施的智能化改造,提高传统基础设施的运行效率。

伴随着技术革命和产业变革,新型基础设施的内涵和外延还将不断丰富和延展。



   人工智能是新基建的重点领域

人工智能推动智能产业化和产业智能化

人工智能是新一轮科技革命和产业变革的核心驱动力,在新基建的三大领域中,两大领域都直接提及人工智能。在信息基础设施领域,人工智能与云计算、区块链一起被视为一种新技术基础设施;而在融合基础设施领域中,人工智能则被视为支撑传统基础设施转型升级的重要工具。人工智能新基建的本质不仅仅指向其自身的产业化发展,更是在实体经济中寻找应用场景,赋能生产力升级,即作为重大应用基础设施,推动各行业完成智能化转型,实现新旧动能的转换。艾瑞咨询测算,2019年人工智能赋能实体经济产生的市场规模超过570亿元。


   人工智能进入认知智能探索阶段

当前呈现弱人工智能状态,在认知智能领域还处于初级阶段

人工智能的本质是进行生产力升级,因此评判人工智能技术是否有价值,要看其应用是否贴近生产核心。一般认为,人工智能分计算智能、感知智能和认知智能三个层次。计算智能即快速计算、记忆和储存的能力;感知智能即对自然界具象事物的识别与判断能力;认知智能则为理解、分析等能力。当前,数据标准化已经趋于成熟,以快速计算和存储为目标的计算智能已基本实现;在机器学习和深度学习技术的推动下,以视听觉等识别技术为目标的感知智能也突破了工业化红线,实现了机器对自然界具象事物的判断与识别。


但感知智能呈现的终究是一种弱人工智能状态,还只能在某一方面的人类工作上协助或替代人类。当人们能使用机器识别更多事物,自然而然地引发了对事物的理解和分析等深层次的自动化知识服务的需求,而需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。学界已经展开认知智能领域的研究,2018年以来,美国人工智能协会收录关于认知智能层面的论文逐年增多,占所有收录论文的比重也有提升。


   知识图谱的定义

用图模型来描述知识和建模万物关系的语义网络

知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的大规模语义网络,是大数据时代知识表示的重要方式之一。知识图谱最常见的表示形式是RDF(三元组),即“实体x 关系 x 另一实体”或“实体 x 属性 x 属性值”集合,其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。由于知识图谱富含实体、概念、属性和关系等信息,使机器理解与解释现实世界成为可能。


上世纪七八十年代,传统的知识工程与专家系统解决了很多的问题,但是都是在规则明确、边界清晰、应用封闭的限定场景取得成功,严重依赖专家干预,一旦涉及到开放的问题就基本不太可能实现,因此难以适应大数据时代开放应用到规模化的需求等问题。相对于传统的知识表示,知识图谱具有规模巨大、语义丰富、质量精良与结构友好等特点,宣告知识工程进入了一个新的时代。


   知识图谱是认知智能的底层支撑

为描绘物理世界生产生活行为提供有效的方法与工具

让机器具备认知智能具体体现在让机器掌握知识,拥有理解数据、理解语言进而理解现实世界的能力,拥有解释数据、解释过程进而解释现象的能力,拥有推理、规划等一系列人类所独有的思考认知能力,而这些能力的实现与大规模、结构化、关联密度高的背景知识是密不可分的。


知识图谱通过对海量结构化和非结构化数据进行知识萃取并关联形成网状知识结构,对概念间的关系属性进行联结和转换,支持非线性的、高阶关系的分析,为描绘物理世界生产生活行为提供了有效的方法与工具,是认知智能的底层支撑。知识图谱帮助机器实现认知智能的“理解”和“解释”能力:通过建立从数据到知识图谱中实体、概念、关系的映射,使机器能理解数据,从数据中提炼出行业或领域内高精度的知识;通过利用知识图谱中实体、概念和关系来解释现实世界中的事物和现象,使机器能解释现象。更进一步的,基于知识图谱和逻辑规则或统计规律,机器能推理出实体或概念间深层的、隐含的关系,实现认知智能的“推理”能力。


   知识图谱的基本构建流程

数据-知识抽取-知识融合-知识加工-知识应用

根据覆盖范围的不同,知识图谱可以区分为应用相对广泛的通用知识图谱和专属于某个特定领域的行业知识图谱:通用知识图谱覆盖范围广,注重横向广度,强调融合更多的实体,通常采用自底向上的构建方式,从开放链接数据(“信息”)中抽取出置信度高的实体,再逐层构建实体与实体之间的联系;行业知识图谱指向一个特定的垂直行业,注重纵向深度,具有丰富的实体属性和数据模式,通常采用自顶向下的构建方式,先定义好本体与数据模式,再抽取实体加入到知识库。


知识图谱的构建遵循知识抽取、知识融合、知识加工、知识应用的基本流程。从海量结构化和非结构化数据中进行实体、关系、属性和事件的信息提取,通过本体和实体对齐、指代消解解决多种类型的数据冲突问题,完成知识融合。将知识存储到知识库中,最后进行进一步的知识推理和图谱应用。