搜索
查看: 4260|: 0

大数据挖掘:灵玖LJKeyScanner网络净化卫士

[复制链接]

215

主题

13

回帖

2181

积分

金牌会员

积分
2181
发表于 2016-12-8 15:55:33 | 显示全部楼层 |阅读模式
  信息过滤是根据用户的信息需求,运用一定的标准和技术,从大量的动态信息流中将与用户无关的信息滤掉,把满足用户需求的信息提供给用户,从而减轻用户的认知负担,提高用户获取信息的效率。
  随着科技的提高,互联网也得到了快速的发展,互联网发展到今天,已经得到很大的普及和应用。目前已经成为一个全球性、开放性、互动性的综合性平台。它容纳了各类型的原始信息,提供了各类型的服务,比如信息获取、网上购物、即时性信息交流等,给人们工作、生活带来很大的便利。可以说它深入人们的方方面面,是人类信息化技术的一次革命。
  网络给我带来便利的同时,也给我们带来许多新的社会问题。由于存在着巨大的经济利益以及世界各个地区与国家、民族之间存在着政治、宗教等矛盾,使得非法人士挺而走险,利用网络开放性的特点,在网上散布各种乱信息、出暴、感情、不实广告等无用信息,严重腐烛人们的身心健康,引起民族之间的强烈感情等,给经济社会稳定发展与人们安居乐业带来及其严重的影响。
  敏感信息监测与过滤技术是网络舆情管理的重要技术,灵玖LJKeyScanner敏感关键词扫描系统正是由于这样的背景和需求下研发出来的。LJKeyScanner组件是灵玖软件多位专家经过不断研发和实验,针对敏感关键词搜索业务需求而打造的一套组件系统,具有专业精准、高扩展性和高通用性的特点。可支持文字、数字、特殊符号、繁体字等各种文本关键词的敏感扫描,支持各类数据库实时搜索服务,并支持多语言。
  LJKeyScanner关键词敏感实时扫描组件功能:
1、全文关键词识别及扫描:支持文字、数字、特殊符号、繁体字等各种文本关键词的敏感扫描,对文章全文关键词可以进行繁简体、变形文字、文章标引等要素进行识别。可以设置一组关键词,可实现实时高效的关键词扫描出来。设置一个关键词,可以自动识别扫描各类敏感词的变体,如繁体形式、中间加各类干扰噪音。
  2、关键词提取:能够对单篇文章或文章集合,提取出若干个代表文章中心思想的词汇或短语,可用于精化阅读、语义查询和快速匹配等。
  3、多类别标签:对原始语料进行分词、自动识别人名地名机构名等未登录词、新词标注以及词性标注。并可在分析过程中,导入用户定义的词典。
  4、自定义的导入用户词表+内置的敏感词库:支持客户自定义导入用户词典,能够提供不同行业的敏感扫描结果。同时,组件内置有十大类型的敏感关键词词典,数十万敏感关键词,其中包括FLG、民运、色感情、涉堵、涉领导人、涉日、政治倾向等敏感词典。能够满足不同的客户需求。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-15 01:27 , Processed in 0.105125 second(s), 25 queries .

快速回复 返回顶部 返回列表