信息爆炸的时代也是信息过剩的时代,我们越来越感觉到被纷繁的信息所累,政治反动、恐怖信息、有害言论、虚假信息、营销广告等不良信息无孔不入,呼啸而来,我们深陷其中,甚至被裹挟吞噬。在这场信息与噪音的对抗中,我们如何冲出迷障,把握主动权? 显然,面对如此海量的信息流,传统人工过滤信息技术发挥的作用只能是杯水车薪,部分技术手段只能通过简单的关键词匹配,错漏百出。北理工大数据搜索与挖掘实验室结合多年的实战经验,利用多项自然语言处理专利算法,推出了九眼智能过滤系统,为不良信息的智能实时过滤提供了全新的技术解决方案! 九眼智能过滤系统是专门针对复杂文本大数据的内容审计系统,可实时智能识别敏感关键词音变、形变与拆字等常见变体,并实现了语义的精准排歧,系统内置了国内最新最全的敏感词库,适用于国家安全、互联网内容发布、传媒出版等领域。。 单机测试界面如下: 其技术架构为: 九眼智能过滤三大技术核心:智能变种+语义排歧+快速实时 1、智能变种识别 利用美双数组TRIE树词典管理与检索方法,系统自动识别形变词、音变词、拆字、噪音、繁简体、全角半角、中间加各类干扰噪音等变体;系统支持自定义敏感词库,增量添加百万量级词库。 2、语义排歧 九眼智能过滤利用NLPIR语义精准分词系统与情感分析系统,精准识别与过滤,排除正面无害的信息,极大降低了误判率。 误判示例:“学习最近平平”、“一次[性交]费5000元”、“我[家宝]贝”、“[插入]银行卡”,买了一袋漂[白粉]。 3、快速实时 快速扫描,单机速度30MB/s;支持单机多线程、多机并行、Hadoop云服务模式,对PB级敏感内容实现并行高效在线核查。 九眼智能过滤特色与优势 九眼智能过滤系统是一套充分融合了自然语言理解、 人工智能、大数据分析等 领域尖端技术,具有智能、高效、自学习三大特点,其特色与优势无可比拟: 九眼智能过滤:沙里淘金,数中寻宝 信息安全问题关乎每个人,我们提倡数据共享,但我们更警惕信息安全!我们秉持着高度的社会责任感,致力于营造一个绿色健康的信息交流空间。我们相信:唯有真,可期待! 九眼智能过滤系统开创信息过滤新技术,将自然语言和人工智能紧密结合,打破传统局限,变被动为主动,将信息过滤工作智能化、语义化、快速化,探索信息监测新可能。
|