卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

知识图谱上的挖掘

    知识图谱上的挖掘

    通过各种信息抽取和数据集成技术已经可以构建Web规模的知识图谱。为了进一步增加图谱的知识覆盖率,需要进一步在知识图谱上进行挖掘,主要技术包括推理、实体重要性排序和相关实体挖掘。

    1)推理(Reasoning或inference)

    推理被广泛用于发现隐含知识。推理功能一般通过可扩展的规则引擎来完成知识图谱上的规则一般涉及两大类。一类是针对属性的,即通过数值计算来获取其属性。例如,知识图谱中包含某人的出生年月,我们可以通过当前日期减去其出生年月获取其年龄。这类规则对于属性值随时间或其他因素发生改变的情况特别油桶。另一类是正对关系的,通过(链式)规则发现实体间的隐含关系,例如,可以定义:岳父是妻子的父亲。利用这条规则,当已知姚明的妻子(叶莉)和叶莉的父亲(叶发)时,可以推理出姚明的岳父是叶发。

    2)实体重要性排序

    实体重要性排序是指当用户查询涉及多个实体时,搜索引擎将选择与查询更相关且更重要的实体来展示。实体的相关性度量需要在查询时在线计算,而实体重要性与查询无关时可离线计算。与传统的网页链接组成的图相比,知识图谱中的节点时各种类型的实体,而图中的边是各种语义关系。由于不同的实体和语义关系的流行程度,以及抽取的置信度不同,这些因素将影响实体重要性的最终计算结果。

    3)相关实体挖掘

    相关实体挖掘是指在相同查询中共现的实体,或在同一个查询会话(session)中被提到的其他实体称为相关实体。一个常用的做法是将这些查询或会话看作虚拟文档,将其中出现的实体看作文档中的词条,使用主题模型(LDA)发现虚拟文档集中的主题分布。当用户输入查询时,搜索引擎查询的主题分布并选出最相关的主题。同时,搜索引擎将给出该主题中与知识卡片所展现的实体最相关的那些实体作为‘其他人还搜了’的推荐结果。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«   2025年5月   »
1234
567891011
12131415161718
19202122232425
262728293031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!