• 绿坝娘眼中的AV什么样?

  • 发表时间:2018-07-12 16:51 | 秀站网 | 点击数:
  • 为了保护小朋友的纯洁心灵,不让他们过早地接触不和谐的内容,程序员们开发了很多自动识别色情图片和AV影片的电脑软件来过滤这些信息。那么,你知道这些“绿坝娘”们都是怎么工作的吗?

    图为绿坝娘的经典形象

    是不是色情作品,一般人扫一眼心里就有数了。但对电脑来说,它们可不会自己分辨屏幕上那对男女是在谈情说爱,还是在宽衣解带。想让电脑知道哪些东西 是不和谐的,还得靠程序员们的调教。不过,想教会电脑看AV并不是一件很容易的事情,因为机器没有七情六欲,没有感情,没有性冲动,唯一能接受的只有各种 数据,程序员们要做的,就是让电脑识别色情作品特有的数据特征。

    识色、辨形、听声

    我们知道,每张图片里的任何一个点都包括亮度值、色相值、饱和度值,通过这三个值的大小的范围,电脑就能识别出“肉色”,进而猜测出图片里裸露的人 体皮肤区域。 而那些“色图”相比于正常图片,最明显的特点就是画面像素中人体皮肤的颜色所占的比例比较大,整张图片比较“黄”,确切地说,研究者发现虽然不同肤色的主 角在光线明暗不同环境下拍出来的皮肤颜色不尽相同,但是画面里人体皮肤的颜色总是在一定的范围内。另外,研究人员还发现暴露的区域图片一般纹理值比较小, 颜色比较平滑,这也可以作为判断人体皮肤的依据之一。

    电脑自动识别出图片里的人体皮肤区域。(图片来自原研究 )

    电脑自动识别出图片里的人体皮肤区域。(图片来自原研究 )

    计算肤色区域的几何关系。 (图片来自原研究 )

    计算肤色区域的几何关系。 (图片来自原研究 )

    当电脑“看到了”图片上有类似于人体皮肤颜色的一些区域之后,需要进一步确定这些区域的来源,看看它们是没穿衣服的女主角,还是来源于正常物体。假 设两块黄色区域分别是两条腿或两只胳膊,另外一块区域是人的身体,这些区域的长度值、宽度值必须符合人体的大小比例,之间的位置必须满足一定的几何关系, 这些都可以依靠电脑的计算得出结果。如果这些区域之间大小和位置不像是人的身体,就可以排除掉色情图片的嫌疑了。

    把肤色和人体构造比例这两招教给电脑是研究者最先想到的解决方案,也是应用得最多的图片自动扫黄方法。凭借这两个简单而有效的主意,美国爱荷华大学和加州伯克利大学的研究人员在1996年发表了一篇名为《找到裸露的身体》( Finding Naked People )的论文(有点标题党的嫌疑)。

    后来,世界各国对于此领域情有独钟的研究人员又想出了各种各样提高识别AV图片准确率的方法。

    例如斯坦福大学的研究者通过对图片进行“小波分析”(编者按:这只是一个数学方法的名称)可以把色情图片里的人体轮廓提取出来,由于同一个女主角可 以被摄像机从不同的角度拍摄,研究者还对提取出的轮廓进行了平移、转动、伸缩的数学变换。接下来,比对被测试的画面提取出的数据和几百张真正色情图片数学 变换提取出的信息,两者越接近就说明被测试的图片越可能是色情图片。这样就能让电脑来判定被测试的图片里,不和谐内容出现的概率大小。

    提取图片里的人体轮廓。(图片来自原研究 )

    提取图片里的人体轮廓。(图片来自原研究 )

    而中科院自动化研究所的研究人员提出的方法里,为了识别电影里是否有限制级片段,可以先分析一下电影里是否含有限制级的声音。他们收集了592段 “声优”的声音片段,然后分析了这些声音信号的十几项参数。根据需要被测试的声音片段的各项参数与这些例子的接近程度,可以计算出一个声音片段是“限制级 声音”的概率,如果概率足够大,就要检查声音对应的视频画面有没有问题了。

分享到:
  • 上一篇:为什么美国投资者会更看好阿里巴巴,而不是京东上市? 下一篇:网络营销执行最看重的是什么?
  • 相关 明星娱乐 资讯
    精彩图库
    • 爱美
    • 健康
    • 情感
    • 美体