搜索
查看: 1356|: 0

NLPIR中文语义分析大数据商业挖掘之道

[复制链接]

215

主题

13

回帖

2181

积分

金牌会员

积分
2181
发表于 2018-6-21 11:11:56 | 显示全部楼层 |阅读模式
  在信息社会里,语言障碍成为大多数人获取信息的最大障碍,数据挖掘系统能帮助我们克服这一障碍。当前市场上有很多数据挖掘软件,但大多为简单分词,不能对文章内容进行深度挖掘,且数据挖掘质量不高,原因之一就在于汉语的分析非常困难。汉语缺乏形态特征,紧紧依靠句法知识进行分析是远远不够的,必须借助语义知识。
灵玖NLPIR中文分词系统.jpg
  语义并不是单一形式的,而是一个包含几个部分的合成体,这就是我们常说的语义的类别。当然,并不是每个单词都有这几种意义,一个词可以只有一种词义类型,也可以同时包括几种类别。但在一个词中,一种语义类型可能要比其它类型更显突出一些。有些词义是固定的,而有些词义只是暂时的,只能在特定语境下才会出现。所有这些都是语义学所要研究的,在词的使用上都很重要。
  为了理解一个提问,一般还需要更多的语义和语用知识来帮助理解句子的意思,通过分析找出词义、结构意义及其结合意义,从而确定句子所表达的真正含义[俞士汶, 2004],而语义信息的标记需要包含概念完全集与关系图的支持,需要对句法成分做出细致的语义分类,它一般应包括语言层面(即反映语言表面现象的知识,如同义词关系、层次关系等)、本体论层面(描述概念之间复杂的语义关系)、常识层面等。
  灵玖软件NLPIR大语义智能分析平台针对中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,先后历时十八年,服务了全球四十万家机构用户,是大时代语义智能分析的一大利器。
  NLPIR大语义智能分析平台平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。
  NLPIR能够全方位多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络采集、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。
  随着信息技术在我国社会生活各个领域应用的深入,中文信息处理正在成为人们工作和生活中不可或缺的手段,中文信息处理将具有更加广阔的市场。这将促使中文信息处理方面的高效中文搜索引擎、实时机器翻译、大规模中文文本处理、跨平台中西文自动识别转换、泛中文语义理解、中文电子商务等技术实现重大突破。NLPIR大语义智能中文信息处理技术已成为中文信息技术研究、发展、应用和产业的提供了重要的帮助,在互联网日益成长的今天,NLPIR大语义智能中文信息处理技术将会更加成熟并创新。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-15 01:42 , Processed in 0.091025 second(s), 27 queries .

快速回复 返回顶部 返回列表