32 Star 67 Fork 44

mz / spider-utils-for-php

 / 详情

能否抓去sogou微信的数据?

待办的
创建于  
2015-06-19 09:01

之前可以很轻松抓去,现在sogou搜索微信内容需要带验证了,不知道是否能解决?

评论 (1)

请求太频繁了肯定是会要验证码的。

说说我现在抓 sogou 微信的数据的方法:

  • 买一台美国服务器,ip越多越好,开 squid 代理。
  • 取得所有代理LIST: ip:port
  • 随机从代理 LIST 里随机抽一条:
spider::GET('http://weixin.sogou.com/weixin?query=sogou&fr=sgsearch&type=2&w=01019900&sut=721&sst0=1435155241051&lkt=0%2C0%2C0', array(
'proxy' =>array(
	'type' => 'SOCKET', //HTTP or SOCKET
	'host' => 'ip:port',
	'auth' => 'BASIC:user:pass',
 )
));

用代理的方式,ip资源多的话,几乎封不掉。

登录 后才可以发表评论

状态
负责人
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
参与者(2)
10962 mz 1578914739
PHP
1
https://gitee.com/mz/spider-utils-for-php.git
git@gitee.com:mz/spider-utils-for-php.git
mz
spider-utils-for-php
spider-utils-for-php

搜索帮助