今日头条败给了色情?AI算法不行,还是另有隐情?

今日头条出事了,相关负责人表示,将严格落实网信部门管理要求,对相关问题进行自查自纠,分别对违规问题严重的部分频道暂停内容更新。今日头条手机客户端“推荐”“热点”“社会”“图片”“问答”“财经”等6个频道自2017年12月29日18时至12月30日18时暂停更新24小时。

这两天,有一篇文章似乎在为今日头条打抱不平《AI 算法起家的今日头条为何败给了色情?》文章称曾经靠 AI 雄霸天下的今日头条,如今也因 AI 的不足,败给了色情。文章指出一些图片会被AI误认为是色情图片。

其实,小编对这种说法持怀疑态度。

1. 在追逐流量下对低俗内容的放纵,不只今日头条,众多的互联网自媒体平台、直播平台都不同程度存在,甚至已经成为潜规则。

2. 如果因为误杀的原因,调大阈值即可,宁可错杀,也不可能会这么多色情消息。

3. 今日头条都没有做任何澄清,如果使用鉴黄策略,究竟是哪一家的?

图片鉴黄哪家强?

中国山东找蓝翔!

认真点,小编不懂鉴黄的算法,更没有足够的数据集去训练模型。如果哪位同学觉得自己有足够的数据集的话,我们可以私下探讨下算法~

好了,我们选取4家知名企业,同时开放公共API的。雅虎,clarifai,阿里和腾讯的鉴黄服务进行了一次测试。

要测试不同公司鉴黄技术的好坏,首先要选择一个客观的测试集,就像考试需要有考卷一样。 由于敏感性,网上很少有公开的色情图片数据集。通过检索笔者找到了一个名为NPDI的色情图片测试集,NPDI色情图片集是巴西一所大学的一个小组发布的,他们收集了80个小时的视频,包括400段正常的视频,200段比较容易混淆的正常视频和200段色情视频,并且通过截帧获取到1万6千张图片,其中色情图片6000多张,非色情10000多张。其中一部分图片如下图所示。


评价指标也要明确一下,这里笔者采用了固定误判率(FAR)下的识别率(TAR)来测试结果进行评价,其中误判率为非色情图片中被误判为色情图片的比例, 识别率为色情图片中被正确识别的比例。例如对于一个包含100张非色情图片和100张色情图片的测试集,有10张非色情图片被模型误判为了色情图片,同时有90张色情图片被正确识别,那么这个模型的误判率就是10%, 识别率为90%。

最终测试结果如下:

  Clarifai  64.80%

  Yahoo  65.42%

  阿里    69.86%

  腾讯    75.90%

看测试结果,腾讯万象优图效果最好(名字也取得好)。但是结果都及格了,更加让小编怀疑,今日头条要么就是自己的算法太懒。。要么就是故意的。我更倾向后者~

文章来源我的公众号:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容

  • AI+金融技术分层解构 从分层的视角来看,AI+金融技术可分为基础层、技术层和应用层三个层面。作为AI在金融领域落...
    shenciyou阅读 2,803评论 1 5
  • 以下都是自己平时知识的一些总结,只是一些个人的愚见,下面出现的公司、书籍、视频、网站都是自己看过体验过的,不是给他...
    放飞人夜阅读 1,545评论 3 14
  • meshgrid np.meshgrid() np.meshgrid从坐标向量返回坐标矩阵。 这样说可能很抽象。举...
    Wang华子阅读 6,013评论 0 10
  • 前几日的生活真的很让我伤心,没有感觉,麻木,按部就班,惯性运做。可是我一点也不喜欢这样的生活,离自己的心越来越...
    娜娜是最美的小仙女阅读 264评论 1 1
  • 【品名】 感召力 【功效】 在演讲或沟通的过程中,能够攻克人们的本能脑、情感脑和逻辑脑这三座堡垒,赢得人心。 一个...
    原圆阅读 389评论 0 5