代码拉取完成,页面将自动刷新
使用jsoup,httpClient创建的爬虫项目
包含基本配置类 数据库配置类,数据库连接类
将每个页面封装成HtmlEntity实体类
自定义异常类
定义了http请求的接口,封装了http请求的执行,并将执行结果以HtmlEntity封装,送到parser解析器中解析
定义数据解析方法,内置$_id(String id),$_class(String class)等方法 解析结构类似html,如样例中的$_id("#ip_list")是解析
里的数据启动接口,内接请求队列接口,目前队列接口尚未完成
代理包,与代理ip相关的一些处理方法,共有两种方法,一种为通过代理ip网站获取代理ip,ip存活期不长 一种是根据收费网站获取代理ip,将ip直接以文件的方式植入程序中
时间相关类,后期可能会封装能用到定时器等时间类接口
工具包
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。