• 防通讯骚扰的云计算

  • 发表时间:2018-07-12 17:46 | 秀站网 | 点击数:
  • 搜狗近日上架一款号码辅助识别软件——号码通,通过抓取互联网中的公开电话信息,建立起海量号码数据库,让诈骗,中介,推销等骚扰号码无处遁形。软件还专门设计“标记”功能,每一个用户都可以对陌生的骚扰号码进行分类标记,同时每个用户对骚扰号码的评价将分享给其他用户,彻底摆脱接到骚扰电话后的自认倒霉的无奈,让层出不穷的骚扰电话彻底歇菜。充分利用智慧众包,让那些漏网的骚扰电话瞬间陷入人民战争的汪洋大海之中。

    号码的云计算

    传统的骚扰电话解决方案是基于本地的黑名单机制,但是这种方式局限性很大,骚扰号码没有规律可循,无法类似E-mail 那种bayes(贝叶斯)的自我学习功能,扩展性也很差。这个已经是标配技术。搜狗号码通在本地基础上加入了云计算的概念,即通过搜索蜘蛛的抓取分析建立一个“号码云”,这也是搜狗基于搜索引擎做号码通的出发点,相当于防通讯骚扰的云计算。它的好处是让 APP 客户端很轻,直接和“号码云”交换匹配即可。

    (部分内容来源于知乎)

    釜底抽薪之道

    骚扰诈骗电话要真正的杜绝,还是要从根源下手,通信运营商从源头来做,根据呼叫记录,自动找出异常呼叫,进行跟踪和查处,从源头打击,不过,遗憾的是,垃圾电话和垃圾短信符合运营商短期利益,要真正的釜底抽薪,还需要一点时间。

    题外话——众包

    号码通的核心功能在于通过用户的标记来识别骚扰电话,再将用户的标记数据共享到服务器,操作模式和方法类似于搜狗输入法的流行词库一样,都是运用大众的智慧共建数据库,实现分享。无独有偶,Google旗下的Google Books也借用了民众的力量去完成纸质书的数字化。Google Books 扫描了几十万本纸质书,通过Google实验室项目reCAPTCHA,扫描后的图片被裁减成一个个单词片段,用于网站防止机器注册时显示的验证码,人们在输入验证码的同时不知不觉就完成了图书数字化过程。世界各地图书馆有很多受损的古籍,页面泛黄、纸张脆弱,OCR 是无能无力的,它无法识别褪色的和模糊的文本,而人类在这方面有卓越的表现。reCAPTCHA将我们输入的验证码正确识别后,拼接、排版,在化整为零中就完成了古籍的数字化。

    当然,有人可能会提到防骚扰红名单,但是,红名单是你用的吗?

    作者:吴江

    原文地址:极客公园

分享到:
  • 上一篇:1号店进入图书网购市场大猜想 下一篇:解密程序员幽默与彩蛋精神
  • 相关 明星娱乐 资讯
    精彩图库
    • 爱美
    • 健康
    • 情感
    • 美体
    Copyrights © 2011-2012 皖ICP备10208435号 Www.dedecmsmb.com 秀站网
    本站除标明"本站原创"外所有照片版权归原作者所有,如有冒犯,请联系本站,我们将立即予以删除!