企业对知识图谱得需求
随着大数据技术的兴起,大多数企业(机构)对内部的数据资产越来越关注,企业(机构)内部构造数据中心或知识管理中心的驱动力越来越强。从相关调查来看,相当多的行业在数据加工、整理与使用方面,都有下列共性需求。
(1)互联网数据采集的需求。互联网上的各类百科、行业网站,以及新闻网站拥有大量有意义的数据,此类数据具有实时性强、内容广泛等特点,利用此类数据可以丰富企业的数据中心。
(2)将非结构化信息转为结构化信息的需求。互联网上的新闻、HTML页面,企业内部的各种文档都以半结构化或文本信息表示。目前,对非结构化信息的主要应用是搜索,搜索队信息的利用相对浅度,如果能够将数据转换成机器易处理的结构化信息,数据将更易于处理。
(3)多源数据统一表示与数据融合的需求。由于数据种类繁多,企业需要有一个统一的数据表示,可以方便地表示各种不同的信息,并且,当新的数据带来时,可以用一种逻辑上合理、技术上可靠的方式,关联到原有数据集合。
(4)数据的可视化展示、查询与问答的需求。传统的关系数据库提供了基础的数据存储与查询功能,但是,由于在关系数据库中,数据表达缺乏显式的语义,数据之间的各类关系并没有表现在数据库中,因此,数据展示与查询都停留在IT层面。企业需要更易用的、面向业务概念的数据访问方式。