安安小课堂:网络爬虫

1

解释:

爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

恶意爬虫目的:

  • 欺骗可以达到有效的广告流量效果
  • 获取全面的动态网站数据
  • 隐私数据获取

举个栗子:

  1. 某酒店今年在节假日推出优惠政策,但被竞争对手用爬虫技术紧紧跟踪价格,只要自己的新价格一放上网上预订页面,立刻被竞争对手使用爬虫爬走数据,以更低的价格更新,陷入价格战。
  2. 某酒店今年在节假日推出一批低价房间,但竞争对手通过爬虫技术批量抢订该批低价房间,又在入住时间截止之前取消入住,不仅真正需要的住户没有享受到优惠福利,还造成大批空置(NO SHOW)房间,妨害了供求双方的利益。

极客实例(by 知乎 李德)

2011年我还在学校读书,写了个软件注册了几十万个微博账号(那时候还不要求实名制),然后养账号,写了几个爬虫软件从微博上爬昵称用来更新我微博上的昵称,从大V的粉丝中爬他们的头像用来更新自己的微博头像(我对不起大家!),从笑话微博中爬微博内容来发到自己微博中。用这这几十万个微博账号去参与抽奖,一年获利了七万多块钱。读书那几年,我承包了我们宿舍所有的水电费,和我们班男生宵夜啤酒鸭霸王的费用。不过现在不做了。

2

这河马哪位啊?!

  • 你好,你是河马吗? ——是的,我是岂安科技微信公众号“安安小课堂”的课堂讲师,河马安安。

  • 为什么是河马啊? ——像我这样憨厚温和的河马是无数卡通片里招人喜爱的形象,但你要知道,河马对自己的领地的有着绝不可侵犯的保护心,正如我们岂安对于业务风控的保护心是一样一样的。

  • 哦哦,那大河马你主要负责什么呢? ——我不叫大河马,我叫安安。从今天起,我的主要工作就是负责‘安安小课堂’的讲解,请大家多多支持!

  • 有那么多高手在,安安你这个小白讲解什么呢? ——是啦,我们岂安随手一抓就是大神,但大神都给你们解决别人解决不了的问题去啦。这个时候,就需要安安我来给很多小伙伴解释一些风控行业的小名词、小典故,以及分享一些心得、故事。如果有想要与大家分享的小故事,欢迎在后台留言,说不定下一个分享出来的就是你的故事。

点击进入岂安的世界