秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”



商悦传媒   2019-04-28 22:43

导读: 从去年年底杭州血腥虐杀流浪狗的谣言引发舆情汹涌、到一个寒门状元之死虚构故事刷屏在信息疯长、传播异常快...

  从去年年底“杭州血腥虐杀流浪狗”的谣言引发舆情汹涌、到“一个寒门状元之死”虚构故事刷屏在信息疯长、传播异常快速的社交媒体时代,朋友圈里时不时就会出现一场关于虚假新闻的风波。

  据麻省理工大学的大规模研究《网络中真实与虚假消息的传播》对比实验,通过推特上300万用户转发过的12.6万条新闻的跟踪研究,无论哪种分类信息、娱乐和生活等,假消息都比真消息传播得更快速、更广泛。

  因此,容易沦陷朋友圈谣言的不仅仅是不熟悉新媒体套路的长辈们,在那些披着科学与新闻故事的外衣的谬误面前,我们每个人都深受其蛊惑。统计数据显示,“微信辟谣助手”上线未满两年,已辟谣文章数就达到了119.92万篇。

  最近,达摩院的科学家们在用AI识别网络谣言的研究上实现新的突破。在刚刚结束的SemEval国际权威语义测试中,达摩院机器智能实验室自然语言处理(NLP)团队创造了谣言识别81%的准确率刷新世界纪录。

  达摩院NLP团队核心成员之一李泉志是“谣言粉碎机”的主要研发专家,本科毕业于清华大学的他,而后在美国获得自然语言理解方向的博士学位,目前在达摩院西雅图办公室工作。

  在加入达摩院前,他曾是世界级通讯社路透社重要的“情报官”:通过机器筛选成千上万的网络信息,为数千位一线记者提供可靠线索。

  “运用AI处理谣言本身就是我们长期研究的方向,社交媒体的蓬勃发展,对于新闻源的判断尤其重要。我们对不同语言的谣言都在研究之中,中国的谣言大多是生活类常识类,而美国的是类居多。自达摩院建立以来,我们就开始启动了这项研究。”泉志说。

  在研发“谣言粉碎机”的过程中,泉志模拟了人脑的思维的过程,同时发挥AI的特有优势,让谣言的判断可以快速实现。

  相比人为的搜索和查证,AI能够更快速和精准地在盘根错节的网络信息里找到最初的信源。分析信源链接的域名,是否来自具有公信力的网站,挖掘出发布信源者的画像。通过发布者在不同社交媒体上的动态与现实生活中的公开信息(专业领域、过去发表内容类型、个人所属的机构、地域、活跃规律等)判断其信誉度。

  然后,AI就可以对文章中关键的论证提炼为信息要素,自动化地进行与维基百科、专业学术文献库等知识图谱里的权威知识库做匹配验证。如果发现内容毫无联系、偷换概念、相互冲突,则将立即列入可疑消息的行列。

  第三步,对传播路径的深入分析。这可是关键“大招”,一条谣言在社交网络里引爆,其中经过了几次传播?阅读后用户的反馈是肯定,还是反驳和质疑?是否有权威网站转载支撑?AI都可以挖掘出来,由此找到消息传播的增减规律、生成评论和传播消息的用户画像。

  这样的统计不仅能统计所有用户的态度,它还会区别对待每条发言的分量。如果行业领域专家、影响力较高的知名人士对于新闻赞同,将增加新闻被判定为真实的权重。

  “AI经过语言学训练,还能够读懂评论是否是人类的反话和嘲讽,用语情绪是高兴还是愤怒,连同用户浏览文章的动机和意图都会纳入判断消息真实性的过程。”泉志说。

  经过三步中计算出的信息会输入到神经网络模型中,基于这些信息,模型会综合判断出此新闻是否为谣言。凭借强大的机器智能计算能力,三个步骤自动同时进行,最快在1秒内就能得到结论。

  有了这样的神经网络模型,AI就能像一个超级大脑一样“思考”。随着处理的数据库的日益庞大,它的判断能力会越来越好。

  为了训练AI“谣言粉碎机”,达摩院NLP团队运用2亿条推特信息、来自上百万条新闻作为素材建立语义网络的最底层,再输入与各类新闻相关的权威知识库建立起了庞大的上层架构。“谣言粉碎机”就如同一个全知全能的“网络”,可获知每条新闻的事实来源与反馈情况,了解消息传播的路径和爆发扩散相关的关键人物与时间节点,第一时间发现可疑虚假信息,遏制其扩散势头。

  泉志告诉记者,这项技术不仅能控制谣言源头,还能防止大规模扩散,“根据传播路径索引,我们可以针对曾经支持过谣言的人,定向推送官方的辟谣信息,改变造谣容易、辟谣难的局面。比如向相信食物相克谣言的人科普正确的膳食常识,告诉曾经转发过酸碱体质说的用户这是骗局等等。”

  在这届SemEval全球语义测试,共有来自哥伦比亚大学、华盛顿大学、艾伦图灵研究所等20多所研究机构参与。所有参赛者需要根据推特和红迪网上470余条新闻、以及一万多条留言、转发等数据,判断这些新闻的真假。

  达摩院NLP团队脱颖而出获得第一,还刷新了本竞赛系列上macro F、RMSE两项关键性指标的世界纪录。达摩院语言技术实验室首席科学家司罗表示,随着社交媒体使用率提升,人工审核的团队越来越庞大,脸书目前已有7000人的人工审核团队,阿里达摩院AI“谣言粉碎机”有望帮助社交媒体的审核机构承担60%的工作量。

  在此之前,达摩院NLP团队曾在机器阅读理解赛事SQuAD上,凭借82.440的精准率打破了历史纪录;在国际机器翻译大赛WMT上,连夺英文中文翻译、英文俄语互译、英文土耳其语互译5项第一。

  在互联网时代,从海量信息中即时快速地获取信息成为每个人的基本诉求。让AI成为人类大脑的延伸、读懂人类的语言,对抗人们爱让“谣言传千里”的“本性”,建立起更高效的语言与数据传播路径,达摩院的科学家们一直在不断刷新着世界纪录,攻克下一座又一座全球技术的高地。