事件图谱/事理图谱
最后更新于
这有帮助吗?
最后更新于
这有帮助吗?
参考资料:《中科院自动化所陈玉博:事件抽取与金融事件图谱构建》、《最新事件抽取技术进展》、《事件知识图谱构建研究进展与趋势》、《事理图谱,下一代知识图谱》
实体知识图谱的优点是构建相对简单、不需要深层语义理解,缺点是实体信息脱离具体的语境存在、存在语义信息的片面性,从而缺乏足够的深层语义信息。
实际上,语义理解的知识来源除了实体以外,还有更重要的与实体相关的行为、状态、转换等具体动作信息。作为一种更高层次的语义单位,事件表达了特定人、物、事在特定时间和特定地点相互作用的客观事实。与实体相比,事件能够更加清晰、精确表示发生的各种事实信息。
因此,和实体知识图谱相比,事件知识图谱具有更深入、丰富、精确的语义表示能力,可广泛应用于各种知识的学习、推理和理解。
我们可以把实体和事件看作两类,实体是一种静态的,而事件偏动态。
下面给出一个事件知识图谱的实例:
图是一个“金正男遇害”话题的事件知识图谱(部分)实例,该图谱展示了“金正男遇害”话题早期的发展过程。
其中,圆圈表示事件,边表示事件关系。
由于篇幅关系,图中省略了每个事件的事件类型、事件的参与者、发生时间、发生地点、关系的可信度等具体信息。
事件知识图谱可以广泛应用于情报分析、信息检索、自动文摘和舆情分析等多个应用领域。例如在情报分析中,可以帮助情报分析员从海量信息中快速获取所关注的某个话题(如:第五代战机研发)相关的事件知识图谱,不仅为情报分析人员节省大量时间减轻工作量,而且更快速、高效和全面。
构建一个事件图谱有两项关键技术:第一是事件抽取,第二是事件关系抽取。
事件抽取分两个步骤:第一步就是事件的发现和抽取,第二个是事件元素的抽取。
事件发现:(应该也叫做“触发词抽取”)是你要让计算机知道读完这一句话,是哪一个词触发了这个类型的事件并且判断它触发什么类型。
触发词(Trigger):用于标识事件的谓词(一般为动词和名词),又称为锚,是事件的基本要素之一,例如“生于”、“出生”等就是出生事件的触发词。
事件元素抽取:要让计算机判断出参与这个事件所有的元素是什么,并且它们在这个事件当中扮演一个什么角色,比如说美团和大众点评合并这样一个事件,其实它描述的就是一个公司合并事件。
事件关系主要包括四类:共指关系,时序关系,因果关系和子事件关系
共指关系:比如说一个事件你会有不同的新闻来源,去描述它不同的侧面,如果识别出这些不同的描述,描述的都是同一个事件,就能判断这是共指关系,这样你就能从各个角度全方位地去认识这个事件,并且追踪这个事件。
因果关系:有了因果关系以后,就可以做很多风控或者是预测。比如日本大地震导致了海啸,最后导致了核泄露。类似这样的因果关系能对风控和预测有参考价值。
时序关系:只要把一个事件结构化,就有时间信息,时序就比较清晰了。
秦彦霞, 张民, 郑德权. 神经网络事件抽取技术综述[J]. 智能计算机与应用, 2018, 8(3): 1-5.
数据集为:ACE2005
(待补充完善)
(待补充完善)
仲伟峰, 杨航, 陈玉博, 等. 基于联合标注和全局推理的篇章级事件抽取[J]. 中文信息学报, 2019, 33(9): 88-95,106.
数据集为:ACE2005
模型组成:采用Pipeline的方法将问题分为3个子问题:
利用序列标注模型对句子进行实体和事件的联合标注
利用多层感知机对事件中的元素进行分类
基于整数线性规划做全局推理,得到篇章级结构化事件信息
使用的是char的Embedding,biLSTM+Attention+CRF的模型结构,进行实体抽取
构建了一个多特征拼接的特征向量,然后送入多层感知机进行Softmax分类。特征向量的组成为:
从句子级抽取了若干个事件,因为在一篇报道中,事件会以不同的角度进行重复,所以,目标函数就是最小化这若干个事件的相似程度。
输入为:
目标函数为:
其中,var_refer表示两个事件的类型是否为同一类型,如果不是同一类型的,则表示为0。
其实可以看得出,这个效果也才达到35%左右的P和R,这个效果指标其实还是比较差的,主要是受到句子级事件抽取的结果影响的。
哈工大社会计算与信息检索研究中心提出了事理图谱的概念,并基于大规模财经新闻文本构建了一个金融领域事理图谱。本文中我中心正式对外发布该金融事理图谱Demo(http://eeg.8wss.com)
参考资料:《事理图谱,下一代知识图谱》、《从工业应用角度解析事理图谱》、
事理图谱:是以事件为节点,事件间的关系为边的图谱网络;
知识图谱:是以实体为节点,实体间的关系为边的图谱网络。
知识(实体)图谱中实体及关系大多是稳定的;事理图谱中关系大多是不确定的,以一定的概率进行转移。
近些年知识图谱的火热也带动起了事理图谱的研究,知识图谱的技术及应用相对已经开始成熟。但只是基于实体知识库,并不足以描述事件之间的演化规律,而事理逻辑对现实世界的行为推演尤其重要。
事件图谱 + 本体 = 事理图谱
简单说来,事件图谱是不含本体的事理图谱,是事理图谱的初级阶段。
在2019年7月20日,哈尔滨举办的“首届事理图谱研讨会”上,对于事理图谱的问答表示:
事件图谱作为事件表示、演化和推理机制的初级阶段的产物,或许只是一个短暂的存在,尔后大家就会殊途同归,快速走向高级阶段。
既然事件表示、演化和推理的最终归宿就是事理图谱,那么我们也可以一步到位,直接把这个研究领域和研究对象命名为 EventGraph,与国际接轨。
本人的理解:本体其实就是对于领域的概念抽象,现在事件图谱构建的是具体的;那么,在具体的事件上,进一步挖掘提出出一般的抽象的概念,就是事理图谱。这就很有马克思主义哲学的意味了。
因为这个事理图谱本就是哈工大新提出的概念,建立在事件图谱上的,事件图谱现在都还没有完全的攻克解决,更没办法谈及更高层次的抽象概念了!