代码拉取完成,页面将自动刷新
正常阅读(查看源文件)
摸鱼阅读😀
Windows | Mac | 作用 |
---|---|---|
alt+. | cmd+. | 下一页 |
alt+, | cmd+, | 上一页 |
alt+; | cmd+; | 跳转指定页 |
alt+m | cmd+m | 老板键🤫 |
如果发现快捷键无用,请检测按键冲突,自行进行修改
基本上每一个网站配置一个抓取组就行了
先进行书籍目录的抓取,提取关键信息 标题title和链接link
正则配置组
在从详情页中爬取内容,只需要大致全选内容content,程序会自动提取文本内容
正则匹配组
tips: 一般内容会存在换行的情况,可以使用 [\s\S]
代替正则通配符 .
。
例如
\<div class="content" itemprop="acticleBody"\>(?<content>[\s\S]*?)\<\/div\>
npm i -g vsce
package
vsce package --no-yarn
vsce login Chensy
code --install-extension chensy.fish-book
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
1. 开源生态
2. 协作、人、软件
3. 评估模型