1 Star 1 Fork 0

张一天 / order_spider

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

order_spider

抓取购物网站(京东、淘宝、亚马逊)的个人订单页面的物品列表以及物品详情

自动抓取京东的个人订单,并提取出书籍列表

1、按照/order_spider/src/common/chrome_cookie.py的提示,将获取的cookie,粘贴到/order_spider/datas/cookie_file/jd_cookie_file.txt
2、进入京东的个人订单页面,把所有的订单页面的URL,添加到/order_spider/datas/url_file/jd_url_list.txt
3、修改/order_spider/src/conf/project_paths.py中的PROJECT_DIR为自己的代码路径
4、运行/order_spider/src/spider_main/jd_spider.py
5、生成结果在/order_spider/datas/output/jd_data,包括所有的商品、书籍商品、非书籍商品三个列表文件

自动生成博客书单

步骤:
1、修改excel中的书单,地址在/order_spider/datas/my_books/input_my_booklist.xlsx
2、运行/order_spider/src/outputers/generate_my_booklist.py即可生成书单的HTML
3、输出HTML地址为:/order_spider/datas/my_books/output_my_booklist.html
4、复制HTML中的内容,到博客文章页面即可


生成的效果地址:
http://www.crazyant.net/my_book_list

空文件

简介

抓取购物网站(京东、淘宝、亚马逊)的个人订单页面的物品列表以及物品详情 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/leoant/order_spider.git
git@gitee.com:leoant/order_spider.git
leoant
order_spider
order_spider
master

搜索帮助

53164aa7 5694891 3bd8fe86 5694891