社交网络已经将互联网变成了一张复杂的人际关系网。社交图形分析为人们提供了一种解读这些人际关系的方法。 由于能够帮助人们识别个人在群体、人际关系和影响等环境中可能做出的行为,社交图形模型已经成为人类行为精确预测模型的强大推动因素。通过聚集人类行为和互动活动,这些模型使得我们能够近距离地仔细评估客户体验。 如果你仅对一些人感兴趣,仅对将他们彼此相连的某一类关系展开研究,或是仅对他们相关行为数据的某个静态池(static pool)进行数据挖掘,那么社交图形分析将会让这些任务变得简单起来。另一方面,如果你正尝试评估地球上每个人、每个地方和每件事情之间每个潜在关系的转变模式,以及他们彼此之间可能说的话,并且想动态地、实时地精准预测他们在未来每个节点上可能要做的事情,那么你无疑正生活在一个科幻世界里。 如今人们已经开始逐渐意识到社交图形分析所具备的潜力将扩展一些应用在公共、私人和研究领域内的应用范围。目前,社交图形分析正迅速发展为大数据市场中一个最具前景的新领域,成为了诸多商业和开源图形数据库的核心应用。在许多行业中,社交图形分析已经让反欺诈、影响力分析、情绪监控、市场细分、互动程度优化、用户体验优化等功能,以及需要快速识别复杂行为模式的应用变得更加强大。 为了获得这些潜在优势,社交图形分析需要使用大量的大数据资源。最起码,你要能够像绘制节点和链接网络那样绘制出实体与人际关系的社交图形模型,或是绘制出个人与相关联系的社交图形模型。此外,图形分析人员还会使用“顶点”和“边”等概念。目前我们已经听说了一些大规模并行公共图形分析基础设施,这些基础设施能够处理由4.4万亿个节点(记录)和70万亿条边(这些记录之间的关系)组成的图形。目前Facebook自有的社交图形分析基础设施能够处理数十亿个节点和近万亿条边。 仔细想一下:网络级图形分析创新方案已经投入大规模使用,例如存储处理、内存、互联、数据中心建设、能耗等,它几乎能够让任何一个你能说出名字的大数据部署相形见绌。随着图形模型大小的迅速膨胀,数据来源范围的不断扩展,所处理的工作负载在数量、类型和并发次数上的不断增长,对实时低延迟速度的需求提升至了一个新高度,扩展性需求无疑也在迅速增长。 图形分析将推动大数据向更大规模和更复杂的程度发展。Hadoop只是这一发展过程中的一个分支,它们未必就是核心。随着专门用于发现、关联和预处理来自各种可能源的行为数据的NoSQL数据库应用范围日益广泛,内存大规模并行图形数据库架构将会崭露头角。 如果你十分关注图形分析,那么你需要提升应对大数据的三个V(即大量化、快速化和多样化)的能力,以更为高效地处理它们。随着组件成本的下降和量子计算架构取得进展,大量机构运行艾字节级(Exabyte)、零延迟、全内存全球图形分析云将有可能成为现实。 |