伦敦神经科学新算法能帮你识别和过滤微博垃圾信息-大数据技术

伦敦神经科学新算法能帮你识别和过滤微博垃圾信息

2013-10-25 00:21 |来自: 互联网| 查看: 1935| 评论: 0

当你看到的时候，你知道微博里充斥着垃圾信息——但是如果你看不到那些垃圾，是不是很爽呢？

不幸的是，分析信息内容的电子邮件过滤软件对微博没有用。因为就那么140个字的一段内容，即使是合法的，读起来也像是尼日利亚网络骗局。而网托儿们往往把陷阱隐藏在链接里。因此微博服务商只能依赖用户举报违法账户。

但是最近伦敦帝国学院一项令人感兴趣的研究发布了一种新的方法。借鉴神经科学的某些计算方法，Gabriela Tavares 和 Aldo Faisal共同开发了一种新的算法，能够鉴别一个Twitter账户（以85%的准确率）不是由正常人使用的，而是挂着自动程序或者（更糟的情况）根本就是个托儿。

这一切都跟时间点有关。通过分析165,000个Twitter用户的使用时间，研究者们发现了三种活动模式截然不同的用户类型——个人、公司和自动程序。这只是开端。这种方法最终会用于为各种社交网络开发有效的过滤系统。

垃圾信息制造者能不能让他们的自动程序模拟人类行为？“那样做非常困难，” Tavares说道（他现在在加州理工学院），“那不是一个确定的模式——不是在一天的固定时刻或是固定间隔发布微博,算法,数据挖掘,数据分析,Twitter消息。这种类型的用户利用机器程序试图扩大潜在销路；不知道想要模仿的行为的参数，就无法模仿。”

制止垃圾信息，似乎是任何人都无法完成的事业。然而，帝国学院的一位神经技术讲师Faisal指出，这样的结果也使得交流元数据带来了更加丰富的信息——一些我们日常网络生活中显得非常琐碎的细节。他说：“这说明即使是最基础的元数据也非常有助于揭示你是什么样的人。”可以想到的是，也许，正因为如此，美国国家安全局正忙于从我们的电话中发掘这样的数据。

事实上，这种新算法不仅能鉴别你是一个守法的Twitter用户，还是一个垃圾信息制造者；它还能够预测你下一次刷Twitter的时间，其准确性令人惊讶——只要你是一个人类。最终证明，人类，作为一个群体，比机器人更加具有可预测性。我们引以为自豪的人类自主性也不过如此啊。那些像机器一样每天按时定点地骚扰你的Twitter很烦人吗？那正是你的朋友们。

免责声明：除非特别声明，文章均为投稿或网络转载，仅代表作者观点，与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如果本文内容有侵犯你的权益，请发送信息至ab12-120@163.com，我们会及时删除

收藏分享邀请

上一篇：量化，教你真正读懂数据 下一篇：可视化大数据，好比双目失明的中校能够闻香识佳人