随着W eb2.0时代的到来,网络成了反映社会舆情的重要载体之一,越来越多的人们通过博客、论坛以及网站留言板发表自己对热点事件的观点和看法。对于某个热点事件,如果将其有关的网络舆情信息加以汇总并且进行分析,就可以反应出对于这个事件民众所持有的态度和观点的倾向性。这种汇总的网络舆情,可以有效地帮助相关政府职能部门了解民意,进而做出及时的反馈。 情感分析(Sentiment Analysis,缩写SA)是基于互联网上发布的内容,辨识出人们对某事物的感情或者感觉,如某个产品、公司、地点、人。这种分析方式最终可能会得到一份完整的报告,描述人们对于一个事物的看法,而不需要你寻找并阅读相关的所有意见和新闻。 在机器学习领域,情感分析属于文本分类问题,它需要检测关于某一个特定主题(topic)的正负面意见。挑战主要是,识别文本中各种情感是如何表达的,它们是否是正面或负面意见。 灵玖LJParser系统语义情感分析针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,对文本文档进行情感分析并总结出相应的结果。 灵玖LJParser系统语义情感分析提供两种模式:全文的情感判别与指定对象的情感判别。情感分析主要采用了两种技术:1.情感词的自动识别与权重自动计算,利用共现关系,采用Bootstrapping的策略,反复迭代,生成新的情感词及权重;2.情感判别的深度神经网络:基于深度神经网络对情感词进行扩展计算,综合为最终的结果。灵玖LJParser系统语义情感分析内容形式包括特定人物的正、负面分析,这样可以从整体看到特定人物对社会观点和事情的态度,从而来判断他的态度是积极的还是消极的 。同时通过喜、怒、哀、乐、惊、惧等几种情感维度分别展现他的性格取向,是稳重型还是冒进型;是积极乐观的还是消极愤世的;这样就可以综合的反应特定人物的情感状态。 情感分析不是单单的对特定人物感情来进行分析,同时还要对特定人物相关事件一起来分析从而得出更加科学、全面的分析报告。灵玖LJParser系统语义情感分析能够实体抽取智能识别文本中出现的人名、地名、机构名、媒体、作者及文章的主题关键词,这是对语言规律的深入理解和预测,并且其所提炼出的词语不需要在词典库中事先存在。灵玖LJParser系统语义情感分析采用基于角色标注算法自动识别命名实体,开发者可在此基础上搭建各种多样化的大 数据挖掘应用。
|