搜索
查看: 1478|: 0

NLPIR知识图谱通过语义智能分析展示文本信息

[复制链接]

215

主题

13

回帖

2181

积分

金牌会员

积分
2181
发表于 2019-7-10 10:57:46 | 显示全部楼层 |阅读模式
  当今社会是一个信息化社会的时代,同时又是一个大数据时代。随着互联网、物联网、云计算和人工智能等信息技术和计算机产业的不断发展和进步,使得数据的处理成为一个亟待解决的问题。现在,一种有效获取知识、发现知识和探测知识前沿的新领域与新手段——以知识单元为分析基础的知识图谱和知识可视化方法,正在蓬勃兴起。由于视觉在人类感知外部信息中起绝对主导的作用,图像又是视觉信息的第一要素,知识图谱能够将抽象信息形象地展现出来,可谓“一图胜万言”。知识图谱不仅创新了科技情报分析的模式,而且改变了人们观察世界的方式。
  知识图谱是以科学知识为对象,显示科学知识的发展进程与结构关系的一种图形。科学知识图谱研究,是以科学学为研究范式,以引文分析方法和信息可视化技术为基础,涉及数学、信息科学、认知科学和计算机科学诸学科交叉的 领域,是科学计量学和信息计量学的新发展。科学知识图谱具有“图”和“谱”的双重性质与特征:既是可视化的知识图形,又是序列化的知识谱系,显示了知识元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多复杂的关系。借助科学知识图谱,人们可以查看庞大的人类知识体系中各个领域的结构,理顺当代知识大爆炸形成的复杂知识网络,预测科学技术知识前沿发展的最新态势。
  北京理工大学大数据搜索与挖掘实验室张华平主任研发的KGB知识图谱引擎,KGB知识图谱引擎(Knowledge Graph Builder)是基于自然语言理解、汉语词法分析,采用KGB语法从结构化数据与非结构化文档中抽取各类知识,大数据语义智能分析与知识推理,深度挖掘知识关联,实时高效构建知识图谱。
  KGB知识图谱引擎功能介绍
  一、文档提取
  1、轻松解析多种格式文档:KGB知识图谱引擎,可轻松解析多种格式、多种版本文档:TXT、DOC、EXCEL、PPT、PDF、XML等。对于图片信息,OCR可自动识别并抽取图片中的文字信息。
  2、结构化表格数据知识抽取:KGB能够自适应解读并抽取结构化表格数据,实现知识的快速生成。
  3、非结构化文档知识抽取:KGB知识规则引擎,快速定位非结构化文档中的关键信息(主体、时间、金额等),高效抽取知识。
  二、知识关联
  KGB知识图谱引擎深入挖掘知识关联,将知识实体链接为有意义的知识事实。并具有强大的知识推理能力,推理暗含的知识与结论,丰富知识图谱。
  三、知识推理
  KGB具有强大的知识推理能力,推理出暗含的知识,获取更多知识与结论,丰富知识图谱。
  1、演绎归纳推理(一般—特殊):KGB能够完成由一般特征到特殊个案的演绎知识推理和由特殊个案到一般特征的归纳知识推理,扩充大量暗含的知识,丰富知识图谱。
  2、知识计算(数值知识的加减乘除计算):对于数值型知识,KGB能够识别并对数值型知识进行加减乘除的知识计算推理,并可对知识计算的准确性进行核查。
  3、知识库检查:KGB能够实时检查知识库,纠正知识错误与冲突,保证知识图谱正确性与一致性。
  随着信息技术在我国社会生活各个领域应用的深入,中文信息处理正在成为人们工作和生活中不可或缺的手段,中文信息处理将具有更加广阔的市场。这将促使中文信息处理方面的高效中文搜索引擎、实时机器翻译、大规模中文文本处理、跨平台中西文自动识别转换、泛中文语义理解、中文电子商务等技术实现重大突破。中文信息处理已成为我国信息技术研究、发展、应用和产业的基础,在互联网日益成长的今天,中文信息处理技术将会更加成熟并创新。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-24 10:51 , Processed in 0.141989 second(s), 24 queries .

快速回复 返回顶部 返回列表