知识图谱在搜索中的应用
知识图谱一经推出,就为语义网搜索带来了新的活力,毋庸置疑,知识图谱已经在搜索的查询理解和基于知识的问答上初显其强大的威力。
1)查询理解
搜索引擎借助知识图谱来识别查询中涉及的实体(概念)及其属性等,并根据实体的重要性展现相应的知识卡片。搜索引擎并非展现实体的全部属性,而是根据当前输入的查询自动选择最相关的属性及属性值来显示。此外,搜索引擎仅当知识卡片所涉及的知识的正确性很高(通常超过95%,甚至达到99%)时,才会展现。当要展现的实体被选中之后,利用相关实体实体挖掘来推荐其他用户可能感兴趣的实体供进一浏览。
2)问题回答
除了展现与查询相关的知识卡片,知识图谱对于搜索所带来的另一革新是:直接返回答案,而不仅仅是排序的文档列表。要实现自动问答系统,一,搜索引擎不仅要理解查询中涉及的实体及其属性,二、更需要理解查询所对应的语义信息。搜索引擎通过高效的图搜索,在知识图谱中查找连接这些实体及属性的子图,并转换为相应的图查询(如SPARQL)。这些翻译过的图查询被进一步提交给图数据库进行回答返回相应的答案。
知识图谱应用总结:
①目前知识图谱还处于初期阶段;②人工干预很重要;③结构化数据在知识图谱得构建中起到决定性作用;④各大搜索引擎公司为了保证知识图谱得质量,多半采用成熟的算法;⑤知识卡片的给出相对比较谨慎;⑥更复杂的自然语言查询将崭露头角(如Google的蜂鸟算法)。
此外,知识图谱的构建是多学科的结合,需要知识库、自然语言处理、机器学习和数据挖掘等多方面知识的融合。有很多开放性问题需要学术界和业界一起解决。我们有理由相信学术界上述方面的突破将会极大地促进知识图谱得发展。