2019中国金融科技产业峰会丨黄铃：通过大数据和人工智能进行金融风控-人工智能

2019中国金融科技产业峰会丨黄铃：通过大数据和人工智能进行金融风控

2019-11-1 22:06 | 查看: 3180| 评论: 0

在2019年11月1日举办的2019金融科技产业峰会之“人工智能在金融领域应用”分论坛上，中国信息通信研究院联合行业协会、金融机构、科技厂商、高校等多家单位，邀请知名学术界专家、行业内顶尖企业工程师，就人工智能在金融领域应用的相关议题开展交流，希望为金融及技术领域从业者提供交流的平台，共同推动行业健康发展。清华交叉信息核心研究院兼职教授黄铃，在“人工智能在金融领域应用”上做出了精彩演讲。

清华交叉信息核心研究院兼职教授黄铃

尊敬的各位来宾、各位领导，早上好！非常高兴能够有这个机会在这里跟大家分享一下我们使用世界领先的大数据和人工智能技术来提供金融风控合规监管的解决方案。

前面也听到徐处长精彩的演讲、认可和支持整个人工智能技术在金融方面的一些应用，而我在以下这些方面就用一些实际的案例给大家分享一下我们具体的应用案例和场景人工智能是怎么在风控、合规领域落地的。

整个构建风控、合规解决方案的一个核心就是使用人工智能的技术来跟我们的金融机构合作，精炼金融机构用户行为的大数据，然后提供这种用户行为的建模来检测客户信息中存在的各种包括欺诈、包括信贷的风险，以及反洗钱合规领域各种风险账户。

人工智能技术在金融领域可能有很多很多各方面的应用，包括我们的投资、智能客服，今天我主要聚焦在整个金融风险控制、合规、内控相关的一系列解决方案，特别是在反洗钱、交易反欺诈、企业内控合规和营销反欺诈等多方面的内控合规的相关的问题。整个这样的背景都在于我们不但要用人工智能和数据分析的手段去建模单个用户的行为异常，同时我们要关心的是在多个账户之间是否会存在着协同合作的风险行为。我们使用的所有数据，我们整个解决方案是部署在银行大数据的计算中心，会根据这些银行机构的交易的行为、账户的一些行为去分析他们存在的这种风险，比如说在他们一些在线的转帐或者手机的支付，或者企业动公业务之间的往来我们分析这些交易是否存在着欺诈，这些帐号是否存在着风险，是否存在着洗钱的团伙等等。

在这样的合规和风控领域，我们整个金融机构、整个金融产业面临的挑战就在于此。首先我们面临的是这种专业化、团伙化，手段非常高明的洗钱、欺诈的团伙。他们做出来的这种欺诈洗钱的行为其手段非常高明，他们可能拥有大量的账户，可以做任意维度、任意手段的转帐、这种掩盖蛛丝马迹的洗钱行为认定，或者欺诈行为认定需要经过我们反洗钱专家和反欺诈专家经过反复的调查才可以得到认定的，所以这样欺诈洗钱账户认定成本是非常昂贵。

另外，在此基础上所有欺诈洗钱的行为，当我们拿到这个标签的时候其实这些欺诈洗钱的团伙已经在我们的银行造成了大量的资金以及品牌的损失，我们才能获得这个标签。但我们希望这样的标签是越少越好。我们面临的挑战是标签非常稀少，但是海量的数据，一家银行可能有数亿的用户，每天会产生数百亿的交易，没有标签的情况下怎么做机器学习、大数据、人工智能的风控，这是我们非常大的挑战。

在行业里面已有的基于规则甚至基于监督机制学习的解决方案，标签非常稀少的情况下还会造成很多的困难。另外，我们也存在着这种我们叫做动力非常强，智商非常高，不断变换行为的欺诈和洗钱行为的团伙，他们每次看到我们的防范手段、看到我们的解决方案，他们会不停测试，找到我们解决方案的漏洞，改变行为规避我们这样的解决方案，所以存在着一种对抗性的解决方案的模式。这里面我们需要更新一代人工智能的解决方案针对这些潜伏性非常强、团伙性非常强的这种欺诈的威胁。

基于这种挑战，整个我们的行业包括人民银行、央行整个监管机构都在寻找一个解决方案能够将我们以前事后风控、事后监管的基础方案能达到一种转变，实现提前、事前的风险管控、事前的监管和事中的这种干预，我们需要的就是能够在少量标签、能够不仅仅是有洗钱欺诈表现之后才能去检测，我们希望能够做到提前的检测方案。

基于这种挑战，我们清华大学包括相关的机构整个在研发一整套，基于半监督主动机器学习的方法形成的金融风控合规监管解决方案，这里面大规模的分析多个账户之间除了交易之外还有很多的关联关系，比如他们是否在同一台设备、同一个地址反复出现，这些账户是在同一时间、同一个注册地址上注册的一批空壳公司等等这样的关联关系去进行建模和检测，综合应用他们的一些交易表现能够做到提前预警。

整个平台是建立在大数据平台上，针对我们银行机构的账户、交易事件以及操作的事件进行建模，在海量的数据很少标签的情况下进行异常检测、关联分析，同时在这个基础上，我们整个平台又能够提供一个非常好的人机协同的交互方式，能够把我们反欺诈、反洗钱一些专家的经验融合到我们平台上，一起进行主动式的机器学习，提供反欺诈反洗钱内控合规的解决方案。

我们看几个实际例子，在这样的平台这样的环境下我们怎么用人工智能防范交易的欺诈。这里我举一个实际的例子，我们信用卡、银行卡被盗刷，在座的很多人都有在海外旅游，信用卡用过之后突然报警，说你的卡可能被非法分子盗刷了。存在的背景就是因为有很多不法分子通过安装一些机器，像麦当劳、加油站（海外），刷卡的时候，很多不法分子会安装这个机器，你刷卡的时候会把你的磁条信息给盗窃下来。还有海外很多商家数据库里面存储了磁条卡、银行卡的信息，他们的安全保护措施又不够，数据库容易被盗用，大量银行卡数据被泄露出去，这些磁条卡的信息会被卖到某一个科技非常发达的地方会被贯之真实的物理磁条卡，这些磁条卡被卖到东南亚、欧洲或者美国进行盗刷，他们会买容易贵重容易出手的商品转卖获利，这条产业链从中国到美国到东南亚是协同合作的全球范围的专业化作案的犯罪团伙来完成整个链条。

面对这样整个的链条，我们怎么用人工智能的手段去建模交易的不正当盗刷行为，这时候我们要主要去分析欺诈链条上最薄弱、最容易呈现出一些行为，能够区分正常人和盗卡盗刷人异同的我们叫做特征或者数据维度的建模，我们针对整个在盗刷环节中他要拿到银行卡之后，他要很快地把银行卡资金刷光，同时购买的东西能够很容易携带、很容易出手这样的行为手段我们去做建模。我们会针对这些刷卡的一系列的行为，包括比如说在这张卡当天交易量是多少，这个交易量跟我们用户历史上的交易量做一些对比，有没有大的偏差，这是一种。这些交易量的购买是不是有连续大额的购买，而且出现在的地理位置是这个用户以前所没有出现过的地方，而且他们购买的东西是不是有特定的类型是很容易出手、价格很高，等等等等这种交易的行为我们去建模，能够区别出盗卡的行为和正常人的行为区别，这里面对整个盗卡盗刷行为整个的实现行为和他获利环节进行精心分析之后，才能结合人工智能的手段去做这样的模型分析，在我们针对结合人工智能手段和业务的很多经验去衍生出来很多变量，能够经过机器学习、图分析相关的方法去自动地进行数据的融合，维度、字段、特征的一些挑选和组合去生成最优化的模型，包括行业里面经常用到的逻辑回归，包括各种基于梯度下降的树模型进行海量数据的特征维度的组合，然后形成我们高质量的模型，进行上线服务。

除了建模之外，我们需要实现的是不但是建模需要做复杂的对于交易事件序列的这种分析，达到我们非常高的准确率和覆盖率，我们还有另外一条要有非常高的时效性，第一我们要求我们整个建模进行的政策要非常准确，因为每一笔不准确的预测都会给我们正常用户造成干扰，我们要求打扰率非常低，十万分之五的打扰率，同时覆盖尽量多的盗刷，80%到以上。当我们覆盖盗刷的时候，整个环节在刷卡一刹那就要进行预警，这时候必须进行实时预测，我们做出来的模型可以在20毫秒之内完成响应，实现目标高覆盖率，低打扰率20毫秒的响应速度，这需要一套人工智能建模、高性能系统支持才能实现的目标。这是第一个案例，就是人工智能在交易、盗刷方面的应用案例。

另外一个应用案例，人工智能对我们的合规、内控、反洗钱提供一整套解决方案。在整个大行业背景包括国内外一些不法犯罪的团伙他们互相勾结，不管在外汇欺诈还是走私、贪污腐败、非法集资等等行业里面进行多种多样的非法资金转移，这是我们在反洗钱方面需要打击的对象。这里面涉及到的银行业务、数据会非常复杂，包括个人业务，包括对公业务，对公业务可能有众多贸易结算、国际结算等等，对私包括ATM取现等多种多样的业务，我们这里面会把各个业务线的交易、账户操作的数据汇总成我们的数据集市，在数据集市上我们综合一系列人工智能评分引擎进行交易排序，进行检测高可疑的风险。同时我们也会用大规模图分析、网络分析去检测那些非常隐蔽、规则性不能发现的协同作战的洗钱行为，从两方面人工智能的风险评估和大规模关联洗钱团伙的检测两方面进行合规和风控建模。

我们看一下第一个场景，人工智能如何对可疑交易进行风险评级，从而能够非常精准地检测抓到这些洗钱的可疑案中。我这里简单介绍一下，整个这个流程都在央行监管机构的指导下，首先银行机构针对它每天的平台上发生的数亿笔交易，依照央行监管机构的要求我们会在内部有一整套规则系统，会对成千上万、上亿笔的交易进行分析，提取出来高可疑大宗的交易，这里面每年可能会提取出来上百万宗的可疑交易。举个例子，任何一个人去柜台取现超过二十万一定是大宗可疑交易，如果柜台转帐从北京转帐到云南、新疆超过五万这一定是可疑交易，你看这样可疑的交易，但是并不是每一个可疑交易一定会是洗钱上报给央行。相反银行机构每年通过柜台提取的上百万个案宗，其中只有五到十万个案宗可以上报给央行，其中90%以上都是误伤。为了减少误伤，银行机构有几百上千反洗钱专家每天都在人工审核归结系统提取出来的可疑案件，人为判断是不是洗钱，百万宗里面挑选出来五万宗上交给央行，这里面有大量的人工工作，有很多成本和资源的配置在里面。针对这样的场景我们通过跟银行的合作建立一整套机器学习方法来对可疑案中进行更精准、全方位的建模和评分。过去我们反洗钱专家，人工已经审核了很多案宗，用案宗作为标签输入到机器学习系统里面去，机器学习会自动学习反洗钱专家审核可疑案件的方式、数据维度以及洗钱模式都可以自动学习起来，从而把专家的一些经验融合到机器学习系统里面，自动对可疑案宗进行排序，从而把高可疑认为是洗钱行为比较高的风险行为提炼出来，让我们的专家去做进一步的人工审核，把其中明显不是洗钱行为的案宗直接剔除掉，这样识别不可疑的交易，帮我们减少审核工作量，提升识别可疑交易效率，帮助人工智能优化反洗钱专家的资源配置。

另外一种方向，我们规则系统提取了数百万的案宗每年，但是因为我们规则系统相对来说是宁可杀错一千也不可放过一错的方案，所以有很多误伤，但是我们用到的很多方法，比如二十万、五万的方法，很多洗钱或者犯罪分子都已经知道了，他可以改变他洗钱、转帐的方式来规避规则系统的检测，可以多帐号、任意维度地去做很多很多隐蔽的洗钱行为，所以规则系统漏掉很多狡猾多变洗钱行为的检测，根据这个痛点，开发一整套基于图分析的检测方式，这时候检测不光看单个账户转钱超过二十万，不仅仅是根据的单个账户的行为，我们更重要的是看多个账户之间的协同合作，整个资金链条的来龙去脉去检测这些跟正常人不一样的转钱倒腾资金的方式，用异常检测的方式帮助规则系统去覆盖到更多的隐藏的多账户之间的协同合作，这时候我们能够发现更复杂的洗钱的案宗，能够优化和增补规则系统看单个账户所不能发现的这种洗钱的行为提高反洗钱的有效性。

综合在一起我们会针对这些洗钱行为里面全方位地提取跟洗钱行为相关的这些信号，获取这种数千上百万的交易的频率、交易的行为以及交易的这种摘要、类别相关联的各种特征去形成我们的机器建模的基础，对特征进行选择和排序，进行关联分析，进行评分。

我们的模型可以自动地跟客户进行分类和排序，把他们的团伙行为检测出来，甚至分类成不同种类的洗钱的这种模式，并针对他们的危险、风险级别进行排序。整个的工作能达到反洗钱专家97%以上的准确率，能够Top70%的召回率99.5%以上，节省30%以上的人工审核工作，检测多种被规则和人工审核所漏检的洗钱案宗大大提升他们的效率。

我这里举个简单例子快速看一眼我们作出的反洗钱的聚类团伙分析是怎么样，这是一个网络图（见PPT），灰色的点是他们共同交易的对手，而有颜色的点，绿色的点是金融机构已经检测出来洗钱的账户，其他的蓝色的点和红色的点和褐色的点都是金融机构以前靠规则系统所检测不到的，但是您可以看到从这里包括交易对手，包括资金的往来都有特定的模式，这些绿色的点跟蓝色的点都跟同样一群的交易对手有着固定交易模式的往来。很显然，很多蛛丝马迹都可以证明他们是一个团伙在一起倒腾资金。这样的话用整个网络的检测，不简简单单绿色的洗钱行为，把整个跟绿色行为经常在一起倒腾资金的整个洗钱团伙全部检测出来，还原出来整个洗钱资金的往来都可以全部呈现出来，这样的话帮金融机构不但把单个人的危险行为提取出来，更重要的是把洗钱的模式、资金的来龙去脉，团伙的整个组织全部重现回来，能够帮助他们更精准地去还原洗钱的行为，进行更精准的审核，降低他们的负担，提高他们审核的准确率，同时增补出规则系统漏掉的很多反洗钱专家的很多失误，因为可以呈现出来以前他没有看到的数据维度，我们有更全面的信息帮助反洗钱专家去做这些审核。

这是我们做过的典型的案例，除了这些典型案例我们有一整套人工智能技术在其他场景上，包括内控审计、智能营销整个环境里面我们提供一整套的建模平台、后台进行大数据的分析和决策的中台。在我们的业务场景中，用我们人工智能引擎不断地去发现这些交易的欺诈、洗钱的团伙、类似的风险团和营销的团伙，整个我们的解决方案都在行业里面处于领先地位，我们交易反欺诈领先于整个行业在10个百分点以上，反洗钱、内审都是比行业先进的解决方案领先30-40%的这种领先程度，能够跟我们银行机构、金融机构能做出来以前在我们这个行业里面没有过的这种创新性的解决方案，达到以前行业里面这些解决方案所不能达到的这种高度。我们也非常非常荣幸，用我们一整套的人工智能的手段能够在金融场景去应用、去推动整个行业的风控、监管的技术上更高一个台阶，而且真正跟监管部门一起合作，实现监管、风控从事后的检测发现进一步推动向事前提前预警和事中干涉，用整个人工智能加上高性能的决策中台一起去实现它。

整个总结下来，通过清华大学整个的合作，同时在这个基础上我们孵化了基于人工智能合规风控解决方案的一家公司，慧安金科，整个的解决方案我们融合了以前在国外十多年做大规模数据无监督、半监督机器学习方法，以及整个方法在地下犯罪、反欺诈、反洗钱多年实战经验，把国外独有的领先模型算法引进过来，开发了独有的半监督的算法，又跟行业里面领先的金融机构一起合作去做整个事前的风险控制和事中检测和事后调查，我们相信这样的解决方案是整个金融风控监管发展的趋势。

整个慧安金科孵化出来的公司，用我们的机器学习的技术和半监督机器学习的方法，跟行业里面领先的金融机构和电商平台进行深入合作，用少量标签挖掘数据的价值，为客户提供反欺诈、反洗钱的决策引擎。我们拥有国际一流的人工智能团队，核心成员来源于伯克利大学、清华大学、香港科技大学等等，我们跟监管机构一起提供人工智能在金融安全风控合规领域整个落地的经验，非常荣幸成为央行监管试点的单位和课题承担的单位。

我们公司包括清华大学整个团队的配置，包括我自己刚才主持人已经介绍了我的背景，除了我自己之外，我们还有一系列的从加州伯克利大学毕业回来在清华、在我们整个行业有着资深的多年的工作经验的创始人在一起创造的这么一个团队。非常荣幸得到国内丁祭资本的支持，包括创新工厂、高瓴资本、DHVC、K2VC等等一系列资本的支持，包括跟行业内金融机构的合作，包括行业一批的各位领导、各位同志的支持，我们一起努力用人工智能这种大规模的数据分析真正能够结合我们金融的风控合规领域的一些痛点问题，帮助我们整个银行机构，包括我们的监管机构把我们整个金融的安全整个技术水平和体系建设能够推高到更搞一个层次。

免责声明：除非特别声明，文章均为投稿或网络转载，仅代表作者观点，与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如果本文内容有侵犯你的权益，请发送信息至ab12-120@163.com，我们会及时删除

收藏分享邀请

上一篇：大数据和人工智能：3个真实世界的用例 下一篇：AI未来如何应对数据饥荒？联邦学习的崛起