1 Star 0 Fork 805

jxtpr / templatespider

forked from 鬼画符 / templatespider 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README.md 2.88 KB
一键复制 编辑 原始数据 按行查看 历史
鬼画符 提交于 2018-02-23 21:00 . v1.2版本升级

所见网站,皆可为我所用-templatespider

看好哪个网站,指定好URL,自动扒下来做成模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹!
项目最初目的为 网市场云建站系统(CMS建站系统) 因模版量少而做。用了之前写的 xnx3 ,以及 Jsoup 。

软件下载

不说没用的,不吹多牛,能直接用,产生价值才是真的!

Windows 系统

点击此处下载 Windows平台 运行软件 软件下载后,解压即可直接使用!

Mac、Linux 系统

点击此处下载可运行jar包 前提是需自行安装JDK8。jar下载后可直接打开运行。

项目分支简介

  1. 看着网上哪个网站好,可用此软件将其下载,变为模版,可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用 application/spider.zip
  2. 下载的模版,采用人工智能,自动进行计算识别,将其转化,导出网市场云建站可使用的模版,做到一键导入使用!(尚未完成)
templatespider                      GitHub目录
├─SourceCode                        项目源代码
│  ├─lib                            依赖的 jar 包
│  ├─src                            java 源码
└─application                       可直接运行的应用(下载后可直接部署起来运行)
  └─spider.zip                      扒网站工具的 Windows 应用程序

软件界面

image

使用步骤

  1. 将要扒取的网站页面的网址粘贴进去
  2. 点击左下方“开始抓取”按钮
  3. 等待抓取完毕,自动打开下载好的文件夹

使用示例

例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:

http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html

设置如下图所示 image

设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。

扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:

image

可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。

Java
1
https://gitee.com/jxe/templatespider.git
git@gitee.com:jxe/templatespider.git
jxe
templatespider
templatespider
master

搜索帮助