今日头条的内容看门狗：“灵犬”

Darcy 1年前

不同于色情信息，处理低俗信息的一个难点在于，人们对于低俗的判断标准具有一定的主观性。

作者：石灿

来源：刺猬公社（ID:ciweigongshe）

2月20日，今日头条方面宣布了“灵犬”全面升级的消息。除了反色情低俗，新版“灵犬”还加入了反暴力谩骂和反标题党能力。

至此，“灵犬”的检测服务，已覆盖了主要的低俗低质内容类型。

据了解，这是上线近一年后，“灵犬”迎来的首个重大更新版本。数据显示，截至目前，“灵犬”使用人次已经突破240万。这也是国内首款反低俗信息小程序。

今日头条有只内容看门狗叫“灵犬”，240万人曾用它来反低俗

一、检测内容健康程度

这款小程序脱胎于今日头条反低俗算法模型，用于鉴定低俗信息。用户将文字或者文章链接放置到搜索框内，即可查询该条信息的健康程度。

据了解，“灵犬”这类技术模型，不仅可以为普通网民所用，用以净化网络空间，同时也有助于平台内容创作者的内容改进。

不同于一般平台对低俗低质内容通常采取人工投诉、事后删除的办法，“灵犬”作为技术手段，能够有效帮助平台将内容质量检测的机制前置，帮助创作者自查内容是否触发色情低俗、暴力谩骂和标题党等因素。

不过，在文字检测上，“灵犬”团队规定，用户输入的字数必须超过10个字才能进行检测。

对此，“灵犬”团队给出了解释：用户给的上下文、语境等信息越充分，机器判断的准确度就会越高。

在2018年3月份，刺猬公社曾参与过“灵犬”的内测，在“灵犬”上检测了“你饿不饿我下面给你吃”几个字，数据显示，该内容健康指数为51%，不及格。

2019年2月20日，刺猬公社再次检测，该内容的健康概率指数为19%，命中反色情低俗模型，“不应获得算法推荐”。

今日头条有只内容看门狗叫“灵犬”，240万人曾用它来反低俗

这是什么意思呢？

“灵犬”就像一个内容审核系统，这个系统集纳了被评定为色情低俗内容的所有关键词，一旦“你饿不饿我下面给你吃”触碰到关键词，该内容将会被提取、分词和语义识别，然后根据设定的规则，输出对应的分数、评级和结论。

中国传媒大学网络法与知识产权研究中心主任王四新教授说，在网络上如果色情低俗内容不被过滤，很容易被当做“产业”进行开发，有商业资本助推，有利可图，在某些国家允许，但在我国不允许，《刑法》对涉及制作、复制、出版、贩卖、传播淫秽物品有明确罪项规定。

他还介绍说，在我国，传播淫秽色情内容，被依法处置的情况很多。此外，还有虚假宣传、谣言……的传播者也会被进行处罚。

但处理低俗信息依旧有难度，“灵犬”团队曾称，不同于色情信息，处理低俗信息的一个难点在于，人们对于低俗的判断标准具有一定的主观性；色情信息很直接，低俗信息偏隐晦，对于像“灵犬”这种机器就更难了。

今日头条的做法是，把低俗的标准分为两个层次：几乎所有人看来都会一致同意的标准底线，和因人而异的主观判断。有些检测标题，因人而异，仁者见仁智者见智。

不过，今日头条方面也称，“灵犬”新版本发布的背后，伴随着“灵犬”打击低俗低质能力的提升。反色情低俗、反暴力谩骂模型，整体识别准确率约为85%，反标题党模型识别准确率约为90%。这些技术模型每天仍在持续优化迭代。

二、国内外都在治理低俗低质内容

近年来，互联网新闻信息、互联网音频、网络直播等互联网文化内容领域，都成了监管部门的重点关注目标，监管部门也出台了不少的监管政策，以规范行业行为。

去年10月，“傅首尔”“紫竹张先生”“有束光”“万能福利吧”“野史秘闻”“深夜视频”“唐纳德说”等9800多个自媒体账号被全网处置。这源于国家网信办会同有关部门，针对自媒体账号存在的一系列乱象问题，开展的集中清理整治专项行动。

在这次网信办的通报中，主要在以下5个方面出了问题，这5大问题也足以值得自媒体人深度警惕：

1、有的传播政治有害信息，恶意篡改党史国史、诋毁英雄人物、抹黑国家形象；

2、有的制造谣言，传播虚假信息，充当“标题党”，以谣获利、以假吸睛，扰乱正常社会秩序；

3、有的肆意传播低俗色情信息，违背公序良俗，挑战道德底线，损害广大青少年健康成长；

4、有的利用手中掌握大量自媒体账号恶意营销，大搞“黑公关”，敲诈勒索，侵害正常企业或个人合法权益，挑战法律底线；

5、有的肆意抄袭侵权，大肆洗稿圈粉，构建虚假流量，破坏正常的传播秩序。

在此基础上，国家网信办又依法约谈了腾讯微信、新浪微博等自媒体平台，对其主体责任缺失，疏于管理，放任野蛮生长，造成种种乱象，提出严重警告。腾讯微信、新浪微博相关负责人表示将认真接受群众和舆论监督，自查自纠，积极整改，严格管理。

随后，微博发布公告，表示将认真接受群众和舆论监督，自查自纠，积极整改，严格管理。微信平台则发文回应称，将加强对政治有害信息、色情低俗、谣言、标题党、抄袭侵权等违规内容的打击和清理，为用户提供一个更健康的阅读空间。

国家网信办有关负责人指出，自媒体绝不是法外之地。近年来，国家网信办依据《网络安全法》相继出台《互联网新闻信息服务管理规定》《互联网用户公众账号信息服务管理规定》等法规性文件，对具有媒体属性和可对公众发布信息的账号及平台作了明确规定。从趋势上看，自媒体管理已经纳入法治化、规范化、制度化轨道。

而今日头条在去年7月和10月，通过自查、用户举报等方式，处罚了近万个违规账号。

今日头条发布公告称，因侵犯版权而受到平台处罚的头条号账号，主要包括搬运、篡改和歪曲等行为：一是未经许可转载、摘编整合或歪曲篡改新闻作品；二是通过“洗稿”方式抄袭剽窃、篡改删减原创作品；三是未经授权复制、表演、通过网络传播他人影视、音乐、摄影、文字等作品，或以合理使用为名对他人作品删减改编。

由此可见，治理低俗低质内容不仅仅是一个平台的事情，而是整个行业的事情。放眼世界，Facebook也因为低俗低质内容而头疼，去年10月份，Facebook直接对发布低俗低质的账号动刀，一下子删除了该平台上559个页面和251个违反垃圾消息规则的帐号。这些网页和帐号使用假帐号来获取点赞和共享，并引诱用户点击欺骗性网站链接，后者大多涉及政治内容。

Twitter也对该同类型内容进行技术提示，Twitter在消息中的链接中添加“可能敏感”标签。据美国科技博客Gizmodo报道，Twitter的媒体政策显示，该公司将“移除有可能被认为是敏感的内容，例如裸露、暴力或医疗流程。”

据新浪科技报道称，业内人士认为，Twitter早就应该推出这项功能，帮助家长控制儿童所看到的内容，以免他们点击不适当的链接。

据王四新介绍，国外社交媒体对低俗低质内容的整治也在不断加强，即便西方国家有制度安排等原因在言论面前做支撑，但近十年来，仇恨、种族、暴力等问题越来越突出，相关言论也在社交媒体上散播，他们需要对其进行治理。

三、“这种方法在未来肯定会大行其道”

2018年11月，今日头条CEO陈林在生机大会上表示，在鼓励优质内容、打击低质内容已经成为全球内容平台的共同议题时，今日头条将开放技术模型，和行业一起提高平台生态标准。开放给社会公众，也是希望能通过开放平台技术，促进全行业发展。“灵犬”此次全面升级，无疑验证了这一点。

据了解，目前，今日头条在平台内容治理方面，除了配备“灵犬”，还有其他反色情、反标题党、反虚假信息、反低质内容等数百个技术模型。与此同时，今日头条投入了上万人专业审核编辑团队，致力于结合人工、技术手段，保障平台内容健康。

面对低俗低质内容，整个社会都在出谋划策。2018年10月31日，《经济日报》发表新闻评论建议，要靠技术来提升低俗内容的识别效率。互联网企业要善用包括大数据、人工智能等新技术，与时俱进地更新内容判定标准，细化审核标准，并升级群发检测算法。只有依靠技术不断完善“游戏规则”，才能让违规内容难以“钻空子”，同时更充分地在版权上保护原创内容，也能防范低俗账号以微博、微信等平台为跳板，将用户导向外部空间再提供违规内容。

这个建议正在被像今日头条这样的互联网公司实践。财经国家周刊编委、新媒体资深从业者王新一评价说，今日头条的slogan是“信息创造价值”，而灵犬则是通过检测出有害的信息来创造价值。内容平台需要两手抓，一方面促进平台产生更多优质信息，一方面尽量减少低俗低质内容的出现。

“企业主动利用这种技术手段来做好内容审核工作是一个不错的方法。”王四新说，其他互联网公司也在利用大数据技术做安全审查工作，比如滴滴用技术防御乘客可能遇到的乘车危险。

而知乎在这方面也有实践。据36氪报道，在2016年，知乎上线了机器人瓦力。瓦力的任务，是识别并处理那些不友善、辱骂、阴阳怪气、答非所问、色情内容以及知乎不鼓励的用户爆照。

这种趋势在近两年逐渐明显了起来，越来越多的企业主动或被动去探讨更灵活、更及时、更有效的技术模型，人工成本会降低。王四新预测，“这种方法在未来肯定会大行其道”。

对行业和社会来说，是好事。

作者：石灿，关注资讯社交平台、泛媒体领域，微信号：S1468002343。

来源：刺猬公社（ID:ciweigongshe）

题图来自Unsplash，基于CC0协议