代码拉取完成,页面将自动刷新
同步操作将从 open_source/MediaCrawler 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
Q: 爬取抖音报错: execjs._exceptions.ProgramError: SyntaxError: 缺少 ';'
A: 该错误为缺少 nodejs 环境这个错误安装 nodejs 环境即可,版本为:v16.8.0
Q: 可以指定关键词爬取吗?
A: 在config/base_config.py 中 KEYWORDS 参数用于控制需要爬去的关键词
Q: 可以指定帖子爬去吗?
A:在config/base_config.py 中 XHS_SPECIFIED_ID_LIST 参数用于控制需要指定爬去的帖子ID列表
Q: 刚开始能爬取数据,过一段时间就是失效了?
A:出现这种情况多半是由于你的账号触发了平台风控机制了,❗️❗️请勿大规模对平台进行爬虫,影响平台。
Q: 如何更换登录账号?
A:删除项目根目录下的 brower_data/ 文件夹即可
Q: 报错 playwright._impl._api_types.TimeoutError: Timeout 30000ms exceeded.
A: 出现这种情况检查下开梯子没有`
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。