2018-05-19 19:39:34
知识图谱数据源1,数据来源1)百科类数据2)结构化数据3)搜索日志2,从抽取图谱到知识图谱 上述所介绍的方法仅仅是从各种类型的数据源抽取构建图谱所需要的各种候选实体(概念)及其属性关联,形成了一个个孤立的抽取图谱。为了形成一个真正的知识图谱,需要将这些信息孤岛集成在一起。 1)实体对齐(数据层) 实体对齐旨在发现具有不同标识实体(ID标识符)却代表真实世界中同一对象的那些实体,并将这些实体归并为
2018-05-19 19:00:36
知识图谱介绍 近两年来,随着开放链接数据(LOD)等项目的全面展开,语义万维网数据源的数量激增,大量RDF数据被发布。互联网正从仅包含网页和网页之间超链接的文档万维网转变成包含大量描述各种实体和实体之间丰富关系的数据万维网。国内外互联网搜索引擎公司纷纷以此为基础构建知识图谱,如Google知识图谱,百度‘知心’和搜狗的‘知立方’,以此来改进搜索的质量,从而拉开了语义搜索的序幕。 知识图谱旨在描述真实世界中
2018-05-19 16:57:48
2.1基于规则的开放问答系统基于规则的开放问答系统背后几乎没有经过严格证明的定理与数学公式,也没有复杂的算法,大多采用模版匹配的方式来寻找最合适的答案。它们的相似点在于对话过程中其回答均基于谈话技巧,而不是根据常识回答。其回答算法依赖于包含大量句型、模板的对话语料库,但其中不包含常识性知识。在面对知道答案的问题时,聊天机器人经常能准确给出合适的回答;而对于那些不知道答案的问题,目前基本有三种常用的回答方法:1)猜一个“无厘头”的答案;2)直接回答不知道;3)用转移话题的方式回避用户的问题。目前市