V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
yvonneday
V2EX  ›  云计算

从日进斗金到折戟沉沙:一个神秘家族的覆灭

  •  
  •   yvonneday · 2016-11-14 16:06:48 +08:00 · 5243 次点击
    这是一个创建于 2918 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在近年来大火的互联网领域,有一个非常神秘的组织。曾几何时,他们一度无孔不入、爪牙遍地、仅仅一年就能吸金数百亿;然而最近一系列黑科技的推出,却让他们的境遇急转直下、处处受挫。

    究竟是什么样的黑科技,让红极一时的他们风光不再?笔者通过秘密途径多方打探,终于掌握到了这个神秘组织最后一次高层会议的内幕。

    一年吸金 900 亿的神秘家族

    一个月黑风高的夜晚,某栋别墅灯光昏暗的地下室里,五个人正在秘密商议着什么。

    为首的是一个坐在阴影中的光头胖子,也是这个神秘组织 Spam 家族的首领,大家都称他为 S 总。围坐在 S 总周围的四兄弟,则是家族里最得力的四大金刚,分别是广小告、黄小文、黄小图、黄小片。

    广小告:“没想到最近风声这么紧,老谣、大暴、小恐竟然都先后进去了。”

    黄小文接下话茬:“是啊,要说最近这形势也变得太快了,今年上半年咱们还数钱数到手抽筋呢。”说到这里,他忍不住又看了一眼墙上那张醒目的剪报,剪报上的标题赫然写着:“过去一年互联网垃圾造成经济损失超 900 亿元!”

    黄小图不无怀念地读起了这则报道:“根据中国互联网协会发布的《中国网民权益保护调查报告( 2016 )》,从 2015 年下半年到 2016 年上半年,短短一年时间内,我国网民因垃圾信息、诈骗信息、个人信息泄露等遭受的经济损失高达 915 亿元。”

    黄小片打断说,“停停停,别说这些没用的,兄弟们该做点啥了。 S 总,您说我们下一步应该怎么行动,才能搬回一局呢?”

    S 总沉默良久,缓缓答道:“现在道上的生意越来越难做,听说好多公司都请了第三方的安保服务来防范我们。不过老夫已有盘算,就凭他们现在的水平,还奈何不了咱们。只要按我的计划,三天之后就能让兄弟们回复从前的风光!”

    无处不在的 Spam 四大金刚

    看到这里,想必不少聪明的读者都已经明白了,这个神秘的 Spam 家族其实就是互联网内容垃圾。自从 1978 年第一封垃圾邮件诞生之后,这个家族就开始迅速繁衍并以惊人的速度扩张,如今已发展出垃圾广告、色情图片、色情视频、网络谣言、暴恐信息等众多分支,其中广小告、黄小文、黄小图、黄小片是该家族的四大主力,而前面提到的老谣、大暴、小恐,则是谣言、暴恐等信息。

    广小告、黄小文、黄小图、黄小片之所以能够成为 Spam 家族呼风唤雨的四大金刚,原因就在于其势力庞大、几乎无处不在。从新闻资讯到图片社区、社交应用,从影音娱乐到视频直播、网络游戏甚至是电商平台,到处都留下了他们兴风作浪的身影。他们 7×24 小时不停歇地发布各种垃圾信息,不仅让互联网产品的内容运营深陷没完没了的监测苦海,也让许多不堪其扰的用户怨声载道、苦不堪言。

    今年以来,为了应对层出不穷的互联网内容垃圾,彻底把这四大金刚拒之门外,已经有不少明智的互联网企业纷纷开始寻找帮手,借助先进的智能反垃圾服务取得了阶段性进展。 后面的事情大家都知道了,随着越来越多企业反垃圾意识的增强,四大金刚最近可谓丢盔卸甲、损兵折将,于是便有了文章开头的那一幕。

    七十二变,难过智能文本监测

    按照 S 总的计划,秘密会议后的第一天,广小告就来到了几个垂直社区,打算大举反攻。 作为 Spam 家族的元老,广小告一出手选择了春雨医生、网贷之家这两大社区。他得意洋洋地打着如意算盘,俗话说,中国人都怕两件事:“有什么别有病,没什么别没钱。”因此在这样的社区散布垃圾广告,往往都是一出手一个准。

    没想到刚一露面,广小告就遭遇了沉重打击。原来,为了防范广小告的骚扰,春雨医生和网贷之家都不约而同地请来了同一家救兵——网易易盾。凭借网易 19 年来积累的海量样本特征库,以及在人工智能、大数据等领域的尖端技术、网易易盾不仅能够实现广告过滤、智能鉴黄、暴恐识别、谣言排查等功能,而且还可以检测识别文本、语音、图片、视频等多种互联网垃圾信息。广小告发布的大批垃圾广告文本,刚刚一冒头就被网易易盾轻松秒删了。 气急败坏的广小告咬牙放出了大招:我变我变我变变变!看你怎么识别?

    只见广小告接连扔出了发票的一系列形近字:(发|犮|拨)(票|栗|粟|溧|镖|膘|骠|鳔|摽|僄|標|墂|幖|磦|熛|蔈|篻|褾),以及花(拼)票等音近字。不过他没有想到的是,不同于传统的关键词技术和规则引擎,网易易盾的智能文本过滤采用了语义分析等深度学习技术,并结合大数据分析,可以轻松应对各种垃圾信息的变种,其识别文本垃圾的准确率可以达到 99.8%,广小告和他的变体们使尽浑身解数,仍然难逃全军覆没的结局。

    智能鉴黄, 0.12 秒即刻分清

    吸取了广小告轻敌的教训之后,第二天, Spam 家族又派出了手段更为高明的黄小图,势要扳回一城。

    为了保险起见,黄小图选择了自己以往建功立业的社交应用斗图神器和足记,还释放了大规模杀伤性武器——海量小黄图。黄小图胜券在握地想,以自己老司机开车的速度,网站的人工鉴黄师小明怎么可能忙得过来?

    然而让黄小图始料不及的是,自己的海量小黄图才刚刚发出,就全被秒删。鉴黄师小明什么时候变得这么厉害了?!

    震惊中的黄小图万万没想到,他遇上的不是老对手小明,而是网易易盾这个劲敌。网易易盾的智能鉴黄云服务可实现精准审核过滤,不但单张图片最快响应时间仅为 0.12 秒,而且准确率高达 99.8%以上。除此以外,网易易盾( http://dun.163.com/)还支持人像识别、动漫识别、图片旋转剪裁识别等多种功能,其图片智能鉴黄审核效率远远高于人工识别,可有效降低 80%以上的人工成本,为互联网企业节省大量垃圾信息审核的开支。自从有了这个分分钟解放鉴黄师的利器,就连网站的鉴黄师小明最近都无事可做,干脆转岗做了销售。

    侥幸逃脱的黄小图在得知真相后,顿时哭晕在厕所。

    最后决战:视频直播平台

    第三天,恼羞成怒的 S 总倾巢出动,派出了黄小文、黄小图、黄小片团伙作战。

    “悄悄地进村,打枪的不要。”三兄弟故意趁着凌晨时分,来到了 Bobo 直播等视频直播网站。因为影音娱乐、视频平台的垃圾信息往往具有突发性、密集性等特点,所以视频反垃圾一直都是业界公认的难点,这也成为了 Spam 家族最为得意的决战地点。

    刚一落脚,黄小片便主攻发布色情视频,黄小文和黄小图则作为辅助,攻占用户头像、昵称等阵地,就连弹幕也不放过。

    然而一阵忙碌之后,等待三兄弟的还是被秒删的命运。原来活该这三兄弟倒霉,他们遇到的是网易易盾专门为视频直播行业打造的反垃圾解决方案。

    针对视频涉黄的识别,网易易盾( http://dun.163.com/)研发了先进的特征提取算法,并运用了先进的图像鉴黄路线和视频语义鉴黄路线相结合的方式,前者可以实现将视频中一帧帧的图像去做图像的鉴黄分析;后者则更加厉害,可以将视频中的场景、人物动作等等进行建模,从场景语义理解的角度识别视频中的人物在做什么,从而做到智能鉴黄识别。至于黄小文和黄小图,则输在了网易易盾强大的文本、图像识别能力,其能实现对头像、昵称等用户公开信息进行检测识别、分类处理,从而深度解决视频直播平台的反垃圾需求。

    另外令三兄弟百思不得其解的是,他们特意选择了夜深人静的凌晨时分作案,居然还是全军覆没,难道网易易盾的工作人员 24 小时都不休息?原来,为了保障反垃圾突发情况的及时处理,网易易盾专业运营团队还提供了 7×24 小时巡检服务,以随时快速相应企业的需求。

    第四天,见势不妙的 S 总选择了携款潜逃,空荡荡的别墅里只留了一张纸条:“网易易盾有 19 年的反垃圾经验,支持单日亿级别数据量的反垃圾运算能力。惹不起,躲得起,各位还是先避避风头吧。”

    20 条回复    2016-11-15 13:49:53 +08:00
    ChiangDi
        1
    ChiangDi  
       2016-11-14 16:14:41 +08:00 via Android
    这个广告不错,可以试用吗,找找黄图
    we000
        2
    we000  
       2016-11-14 16:17:42 +08:00   ❤️ 3
    太长, 懒得看
    cooka
        3
    cooka  
       2016-11-14 16:22:35 +08:00
    这*装得不错, 多了很多细节在里面, @aliyun
    zz
        4
    zz  
       2016-11-14 16:28:03 +08:00
    @aliyun 是? 你们装 BI 装得又大又深啊
    lhx2008
        5
    lhx2008  
       2016-11-14 16:28:41 +08:00 via Android
    鉴黄挺有意思的
    jy02201949
        6
    jy02201949  
       2016-11-14 16:38:14 +08:00
    这广告的链接把整段文字都包含进去了,也是拼
    jy02201949
        7
    jy02201949  
       2016-11-14 16:41:35 +08:00
    试了一下文本识别率还不错
    ethankoo
        8
    ethankoo  
       2016-11-14 16:42:46 +08:00
    黄易打这个广告真的好么 2333
    SeaOverflow
        9
    SeaOverflow  
       2016-11-14 16:49:40 +08:00
    话说一直在说产品可以除广告,却不知自己也是属于“广小告”。这听起来很喜感,这个产品可以把自己的这个广告去除掉么?
    ichubei
        10
    ichubei  
       2016-11-14 16:49:48 +08:00 via Android
    百度贴吧黄语音广告很多
    w88975
        11
    w88975  
       2016-11-14 17:07:40 +08:00
    ![ ]( )

    网易老司机
    liuyq
        12
    liuyq  
       2016-11-14 17:20:58 +08:00
    怎么感觉这个内容看过啊,广告都抄?
    lrh3321
        13
    lrh3321  
       2016-11-14 18:04:18 +08:00
    @jy02201949 估计是因为错用了全角的括号
    est
        14
    est  
       2016-11-14 18:16:11 +08:00
    @w88975 蛤蛤蛤蛤。
    anuxs
        15
    anuxs  
       2016-11-14 21:54:48 +08:00 via iPhone
    有没有举报按钮?写的差。还是个广告。
    mingyun
        16
    mingyun  
       2016-11-14 23:19:01 +08:00
    记得阿里云也有个鉴黄接口
    twomoe
        17
    twomoe  
       2016-11-14 23:40:24 +08:00
    @anuxs 页面下方“报告这个主题”
    JamesMackerel
        18
    JamesMackerel  
       2016-11-15 07:49:04 +08:00 via Android
    看这个广告的时候感觉蜜汁尴尬。
    zqiyun
        19
    zqiyun  
       2016-11-15 08:00:43 +08:00
    中二病又范了
    KingHL
        20
    KingHL  
       2016-11-15 13:49:53 +08:00
    又臭又长
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2681 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 08:37 · PVG 16:37 · LAX 00:37 · JFK 03:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.