登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
Gitee AI
NEW
我知道了
查看详情
登录
注册
代码拉取完成,页面将自动刷新
开源项目
>
WEB应用开发
>
Web爬虫
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
1.2K
Star
4.8K
Fork
1.9K
GVP
黄亿华
/
webmagic
代码
Issues
61
Pull Requests
5
Wiki
统计
流水线
服务
Gitee Pages
JavaDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
我知道了,不再自动展开
全部
全部
清除搜索筛选条件
看板
里程碑
全部
开启的
61
进行中
0
已完成
10
已关闭
0
高优先级
默认排序
最新创建
最早创建
最近更新
最早更新
高优先级
低优先级
优先级
不指定
严重
主要
次要
不重要
里程碑
无里程碑
标签
无标签
负责人
创建者
提供的 webmagic-samples 中的实例运行报错,在网上找到解决办法加了个slf4j-nop 之后不报错了,但是执行完没结果
#I894W2
明济安
2
请问不支持[last()]语法嘛
#IBSOZ
lengleng
跟spring配合使用的时候保存数据并不是很舒服
#ICY6D
Skqing
UrlUtils.fixAllRelativeHrefs会过滤掉迅雷下载链接
#ID821
aceasm
1
是否支持抓取浏览器向下滚动,动态加载数据的列表页?
#IJ6DY
Jin
xpath中如何进行文本内容的匹配
#I8HA8Q
chinkiang
1
爬取指定网页并查询数据后,能否截图网页内容并保存下来呢?
#IZEAM
DreamCat
使用代理无法抓取,
#I10C2M
zhy_black
Apache HttpClient Cookie rejected处理
#I6TK2
黑糖
processor 中的方法 process 线程安全问题
#I5VE2
黑糖
下载失败后,流程/逻辑不正确。
#I1NSJ3
Sel
Non-resolvable parent POM: ...... 'parent.relativePath' points at no local PO...
#I8QI8
hanphy_cai
xpath怎么拿当前节点的父节点
#I477ZM
hanpo.cheng
1
可以在spider中的onError方法中添加个Exception参数吗?想在里边统一进行异常处理。
#IBBJW
沙皮狗的忧伤
spider中initComponent方法的设置线程数问题
#IBBJZ
沙皮狗的忧伤
是不是对xpath支持的不全啊
#IEVD9
Lison
1
解析器正则匹配时,无法取到值
#IKE39
风中.
如果在运行过程中监控cookie过期并及时切换cookie?
#IMCEW
JungleKing
2
在请求资源的时候,出现连接超时了,然后我通过listener去捕获结果的时候,调用到的是onSuccess
#IOMZE
true&false
1
0.7.3版本: maven依赖下载失败
#IFSDF
阿林
Java
1
https://gitee.com/flashsword20/webmagic.git
git@gitee.com:flashsword20/webmagic.git
flashsword20
webmagic
webmagic
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册