搜索
大数据中国 首页 大数据技术 查看内容
伦敦神经科学新算法能帮你识别和过滤微博垃圾信息
2013-10-25 00:21 |来自: 互联网| 查看: 1809| 评论: 0

当你看到的时候,你知道微博里充斥着垃圾信息——但是如果你看不到那些垃圾,是不是很爽呢?

不幸的是,分析信息内容的电子邮件过滤软件对微博没有用。因为就那么140个字的一段内容,即使是合法的,读起来也像是尼日利亚网络骗局。而网托儿们往往把陷阱隐藏在链接里。因此微博服务商只能依赖用户举报违法账户。

但是最近伦敦帝国学院一项令人感兴趣的研究发布了一种新的方法。借鉴神经科学的某些计算方法,Gabriela Tavares 和 Aldo Faisal共同开发了一种新的算法,能够鉴别一个Twitter账户(以85%的准确率)不是由正常人使用的,而是挂着自动程序或者(更糟的情况)根本就是个托儿。

这一切都跟时间点有关。通过分析165,000个Twitter用户的使用时间,研究者们发现了三种活动模式截然不同的用户类型——个人、公司和自动程序。这只是开端。这种方法最终会用于为各种社交网络开发有效的过滤系统。

算法

垃圾信息制造者能不能让他们的自动程序模拟人类行为?“那样做非常困难,” Tavares说道(他现在在加州理工学院),“那不是一个确定的模式——不是在一天的固定时刻或是固定间隔发布微博,算法,数据挖掘,数据分析,Twitter消息。这种类型的用户利用机器程序试图扩大潜在销路;不知道想要模仿的行为的参数,就无法模仿。”

制止垃圾信息,似乎是任何人都无法完成的事业。然而,帝国学院的一位神经技术讲师Faisal指出,这样的结果也使得交流元数据带来了更加丰富的信息——一些我们日常网络生活中显得非常琐碎的细节。他说:“这说明即使是最基础的元数据也非常有助于揭示你是什么样的人。”可以想到的是,也许,正因为如此,美国国家安全局正忙于从我们的电话中发掘这样的数据。

事实上,这种新算法不仅能鉴别你是一个守法的Twitter用户,还是一个垃圾信息制造者;它还能够预测你下一次刷Twitter的时间,其准确性令人惊讶——只要你是一个人类。最终证明,人类,作为一个群体,比机器人更加具有可预测性。我们引以为自豪的人类自主性也不过如此啊。那些像机器一样每天按时定点地骚扰你的Twitter很烦人吗?那正是你的朋友们。

免责声明: 除非特别声明,文章均为投稿或网络转载,仅代表作者观点,与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如果本文内容有侵犯你的权益,请发送信息至ab12-120@163.com,我们会及时删除

最新评论

关闭

站长推荐上一条 /1 下一条

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-22 02:03 , Processed in 0.117897 second(s), 23 queries .

返回顶部