谷歌AdWords广告的算法有助于发现和打击犯罪?科技博客网站The Verge日前在一篇文章中介绍了谷歌AdWords团队发现一类盗车销赃案的经过。以下为文章原文:
AdWords系统跟汽车有仇?
AdWords关键字广告是谷歌的核心业务,每年都有数十亿则广告通过AdWords投放。这些广告大多都是合法的,但也有一部分违法广告,而谷歌一旦识别出违法广告就会毫不留情地予以取缔——在2012年,谷歌取缔了多达2.24亿则广告。
被取缔的违法广告大多涉及仿冒皮包、钓鱼网站之类的欺诈行为,过滤这些欺诈信息也并非难事。但是在2010年,谷歌刚刚改动过的最新广告过滤模型发生了奇怪的事情——很多看上去没什么问题的二手车广告被标记了出来。大多数违法产品都是仿货,而AdWords工程总监大卫•贝克尔(David Baker)表示:“我们对仿造汽车还真是闻所未闻。”难道他们把AdWords“训练”得对汽车有偏见?难道模型出了问题?
从线上到线下的中国式骗局
结果,最后的答案更加离奇。广告里的汽车都是真货,不过它们其实来路不正——骗子在街上拍下这些汽车的照片,如果有倒霉的顾客看上了某辆车,骗子就把这辆车偷来卖给顾客。等到顾客发现自己买了被盗的赃车时,骗子早已卷钱远走高飞了。这种利润可观的骗局在中国很出名,但是在网上打出的广告却与普通二手车别无二致。
然而,对于研究中国诈骗案件的专家来说,这种骗局并不稀奇。“这些作案者非常专业。”在明尼苏达大学研究中国网络诈骗的信息系统专家李大辉(Dahui Li)如是说道。他指出,在此类汽车骗局当中,离线环节是最重要的,因为骗子必须说服心有疑虑的顾客相信交易的合法性。“中国人喜欢在付款之前看到产品。”李大辉说道,“他们一定要看到那辆汽车。”所以,作案者设计出了一套能向顾客展示汽车的计谋。
李大辉表示,中国的金融系统要求每一笔跨行交易必须通过央行授权才能进行,这就导致反欺诈措施往往比作案者的动作来得晚一步。终止一笔支付交易有时要耗时三天之久,这时候损失往往已经无法挽回了。消费者们不能指望银行来遏制欺诈,于是只能采取自我防护措施,例如在淘宝上购物时通过更多交流和检验来确认卖家可靠、交易合法。李大辉指出,为了骗取消费者的信赖,骗子会把虚假网站做得酷似淘宝或其他电商网站,而且他们的动作比警方对信用卡信息的追查更快。
骗得了人,却骗不了机器
那么,谷歌AdWords系统如何检测出了盗车销赃这种严重依赖线下环节的骗局呢?AdWords监管团队只负责找出发生在AdWords网络上的欺诈广告,但是盗车销赃案却模糊了网络犯罪与现实犯罪之间的界限。其实AdWords的犯罪监测工具并不能区别线上与线下诈骗,它们只能找出可疑的行为。像谷歌的很多产品一样,AdWords的质量控制也是由一种庞大的机器学习算法掌管的。贝克尔指出,这种算法会综合考虑成千上万的信息片段,包括IP地址、账号年限、与以往账号之间的关联,等等。经过无数次循环之后,被标记违规的广告很难追溯到任何一组特定因素,这让AdWords系统变得更难被不法分子利用。
更重要的是,这种算法并不带有人为因素的偏见——贝克尔和他的团队并未刻意搜寻汽车或盗车贼,但是算法发现了来自新建账号的快速交易,并且将其与很多更广泛、更微妙的范式关联起来,于是推断出其中必有蹊跷。这一系统也并非万无一失,但是在这起盗车销赃案中,它所发现的大洋彼岸的犯罪模式是谷歌的工程师们始料未及的。文化差异骗得了人,但却骗不了机器。
与此同时,谷歌在发现这些骗子之后也不会仅仅把他们踢出AdWords完事——贝克尔和他的团队有时会对违法广告提起诉讼,尤其是针对涉及毒品的案件。谷歌并非一家对抗犯罪的机构,但是它在维护自家网络的同时,也对打击犯罪起到了一定作用。