代码拉取完成,页面将自动刷新
node index.js
运行爬虫脚本let h = 50;//内容循环次数 定义你要循环的次数,用于页面数据更新,值越大获取的数据越多,取决于当前页面数据量
// 填写你要爬的网络地址
await page.goto(
"https://www.bilibili.com/video/BV1ym42177Hy/?spm_id_from=333.1007.top_right_bar_window_dynamic.content.click&vd_source=3fb379bdd5d3e5bd63fada6189f6d4b6"
);
下面是填写自己寻找到的标签
"div > div > div > div.reply-warp > div.reply-list > div > div.root-reply-container > div.content-warp > div.root-reply > span > span"
data.json
文件下pip install WordCloud -i https://mirrors.aliyun.com/pypi/simple/
安装依赖start.py
word-cloud.png
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。