1 Star 0 Fork 53

bxstar / MediaCrawler

forked from open_source / MediaCrawler 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
常见问题.md 965 Bytes
一键复制 编辑 原始数据 按行查看 历史
NanmiCoder 提交于 2023-12-09 13:56 . refactor: delete account_config.py

常见程序运行出错问题

Q: 爬取抖音报错: execjs._exceptions.ProgramError: SyntaxError: 缺少 ';'
A: 该错误为缺少 nodejs 环境这个错误安装 nodejs 环境即可,版本为:v16.8.0

Q: 可以指定关键词爬取吗?
A: 在config/base_config.py 中 KEYWORDS 参数用于控制需要爬去的关键词

Q: 可以指定帖子爬去吗?
A:在config/base_config.py 中 XHS_SPECIFIED_ID_LIST 参数用于控制需要指定爬去的帖子ID列表

Q: 刚开始能爬取数据,过一段时间就是失效了?
A:出现这种情况多半是由于你的账号触发了平台风控机制了,❗️❗️请勿大规模对平台进行爬虫,影响平台。

Q: 如何更换登录账号?
A:删除项目根目录下的 brower_data/ 文件夹即可

Q: 报错 playwright._impl._api_types.TimeoutError: Timeout 30000ms exceeded.
A: 出现这种情况检查下开梯子没有`

1
https://gitee.com/bxstar/MediaCrawler.git
git@gitee.com:bxstar/MediaCrawler.git
bxstar
MediaCrawler
MediaCrawler
main

搜索帮助