登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
Gitee AI
NEW
我知道了
查看详情
登录
注册
全部推荐项目
前沿技术
智能硬件
IOT/物联网/边缘计算
车载应用
智能家居
自动驾驶/无人机
机器人
5G/通讯
低代码
科研论文
量子计算
芯片开发
Web 3.0
隐私计算
云原生
OpenHarmony
按钮(Button)
文本框(EditText)
布局(Layout)
图形图像(Image)
进度条(Progress)
菜单(Menu)
弹窗(Popup)
选择器(Selector)
文本组件(TextView)
列表组件(ListView)
加载器(Loading)
提醒(Notification)
视图切换(View Transition)
滑杆(Slider)
图表(Chart)
绘图组件(Draw)
计数器(Counter)
动画(Animate)
验证码(Captcha)
多媒体(Multimedia)
条形码(Barcode)
高级UI组件
地图(Map)
OpenHarmony 游戏(Gaming)
网络(Networking)
通讯(Communication)
支付(Payment)
数据库(Database)
硬件驱动(Drivers)
OpenHarmony 教程指南
OpenHarmony工具集
OpenHarmony 应用
华为移动服务(HMS)
权限(Permissions)
工具包(Toolkit)
底层组件
手势控制(Gesture)
程序开发
中英文分词
支付开发包
安全开发相关
常用工具包
Excel工具包
条形码/二维码
模板引擎
桌面UI组件/框架
网络开发包
语音处理
网络工具
网络服务
数据挖掘
作业/任务调度
编程语言/脚本语言
缓存组件
Markdown工具包
搜索引擎
微服务
工作流
图表组件
权限管理
报表工具
代码生成器
IoC/AOP框架
图像处理
规则引擎
JSON工具
日志工具包
Spring Boot 扩展
验证码
算法/数学计算
Node 扩展
流程引擎/工具
动画开发
移动通信
人工智能
AI-人工智能
VR/AR
机器学习/深度学习
计算机视觉/人脸识别
自然语言处理
大模型
区块链
数字货币
NFT
微信开发
微信开发包
微信小程序/小游戏
微信应用
微信小游戏
企业应用
任务/项目管理
企业应用系统
BI-商业智能
金融/股票证券
GIS/地图/导航/定位
建站系统
CMS建站系统
新零售/网店/商城
BBS论坛/问答
博客系统
问卷调查/表单系统
SNS社交系统
学校/教学管理
相册/画廊/照片
RSS/Atom工具
应用工具
文件管理工具
多媒体
文本编辑
IM即时通讯/聊天
应用软件
RPA-机器人过程自动化
WEB应用开发
Web开发框架
jQuery插件
WebUI组件/框架
JavaScript工具包
RESTful项目
后台管理框架
网站主题
Vue扩展组件
Web爬虫
OAuth/单点登录/统一认证
Angular扩展
Bootstrap扩展插件
React 组件
RPC开发框架
API 网关/接口管理
短网址
layui 组件
DevOps/运维/网管
网管工具
监控系统
DevOps工具
手机/移动开发
Android组件/项目
iOS组件
移动App
支付宝小程序
百度小程序
PhoneGap/Cordova 插件
跨平台移动开发
快应用
TV/电视开发
uniapp 开源组件
开发工具
版本管理系统
开发/调试
Wiki/文档工具
编译/构建/部署
Maven 插件
Gulp 扩展
测试工具
代码扫描分析
服务器应用
分布式服务/框架
消息服务器/消息队列
Docker相关
容器/虚拟机
Nginx扩展模块
大数据
云计算
一键安装包
OpenResty 扩展
系统性能优化
Serverless
分布式存储系统
数据库相关
数据库开发包
数据库服务
数据库管理/监控
游戏/娱乐
游戏
游戏开发
3D引擎
插件和扩展
Chrome扩展
WordPress 扩展
Eclipse插件
IDEA 插件
Firefox扩展
Safari 插件
Visual Studio Code 扩展
Jenkins 插件
其他开源
高仿项目
图书/手册/教程
ACM/OJ 项目
操作系统
教学管理
教程配套代码
RISC-V 开发
生物/医疗/健康
2020公益黑客马拉松
新冠病毒相关开源
WEB应用开发
/
Web爬虫
MIT
全部项目
MulanPSL-2.0
0BSD
AFL-3.0
AGPL-3.0
Apache-2.0
Artistic-2.0
BSD-2-Clause
BSD-3-Clause
BSD-3-Clause-Clear
BSL-1.0
CC-BY-4.0
CC-BY-SA-4.0
CC0-1.0
ECL-2.0
EPL-1.0
EPL-2.0
EUPL-1.1
EUPL-1.2
GPL-2.0
GPL-3.0
ISC
LGPL-2.1
LGPL-3.0
LPPL-1.3c
MPL-2.0
MS-PL
MS-RL
MulanPSL-1.0
MulanPubL-1.0
MulanPubL-2.0
NCSA
OFL-1.1
OSL-3.0
PostgreSQL
UPL-1.0
Unlicense
WTFPL
Zlib
Python
全部语言
Java
JavaScript
HTML
CSS
Shell
C
C++
PHP
C#
TypeScript
Go
Objective-C
Android
Kotlin
Ruby
Assembly
Swift
NodeJS
Perl
Dart
Lua
Matlab
其他
Rust
PowerShell
HTML/CSS
微信
Scala
Groovy
C/C++
XSLT
Verilog
R
Docker
QML
Pascal
CoffeeScript
FORTRAN
Erlang
ActionScript
Emacs Lisp
Smalltalk
SQL
Delphi
TeX/LaTeX
VHDL
ASP
Visual Basic
M
Clojure
Common Lisp
Haskell
Awk
LiveScript
Elixir
Scheme
易语言
Julia
OCaml
Puppet
YAML
AutoHotkey
Ada
Pawn
Standard ML
D
XML
Arduino
Logos
VimL
Prolog
汇编
Haxe
ColdFusion
Vala
Crystal
Scilab
Coq
Racket
Lisp
Slash
Eiffel
eC
DOT
Zephir
Nemerle
最近更新
Stars
最新推荐
最近更新
AJay13/ECommerceCrawlers
GVP
4.2K
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
Python
Web爬虫
|
2个月前
Herche Jane/IntelliScraper
41
它是一个先进的网络爬虫工具,利用 BeautifulSoup 和机器学习技术实现高效的数据提取和分析。
Python
Web爬虫
|
3个月前
PeaceXie/Wepy
1
Python开源 | 生活是艰难的:甚至需要爬…… 但是,微爬(Wepy),却尽量让您轻松愉快的爬知识,爬价值,爬乐趣!
Python
Web爬虫
|
1年多前
shengqiangzhang/examples-of-web-crawlers
472
一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )
Python
crawler
Selenium
wechat
Taobao
Python
Web爬虫
|
接近2年前
mktime/scrapy-douban-group
356
通过一个实际的项目,来学习如何使用scrapy爬取网络上的信息。这里以豆瓣小组为例,对组内的图片进行爬取,相关信息保存数据到MongoDB,图片下载到本地。
Python
Web爬虫
|
接近3年前
makeit.vip/miitvip-official-regions
1
根据官方权威站点,获取省 / 市 / 县 / 镇 / 街道等全面的地域数据,采用 Python 抓取,但西祠代理似乎不能使用了,可尝试修改其它代理进行处理。
Python
Web爬虫
|
3年前
DTC2/ECommerceCrawlers
434
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、闲鱼、阿里任务、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家️️️
Python
Web爬虫
|
3年多前
tansty/CSDN-spider
46
爬取csdn的文章并转换为md格式
Python
Web爬虫
|
3年多前
ZICK_ZEON/doufen
7
将你的豆瓣帐号数据备份到本地并支持脱机浏览来自豆瓣的朋友@tabris17,此项目已经停止维护
Python
Web爬虫
|
3年多前
alphardex/looter
6
A toolkit to help you make crawlers at ease.
Python
Web爬虫
|
接近4年前
dwbmio/scrapy_proj
42
因为是oschina所有都是大中文了:)起因是看到一个网站很多kindle的资源丧心病狂想占为己有全部趴下来 自然使用了scrapyscrapy刚需安装beautifulsoup刚需安装mongodb随存储方式安装python渣要开始啦
Python
Web爬虫
|
接近5年前
温良恭俭让/爬虫_百度贴吧
2
爬取百度贴吧指定的信息并保存;
Python
Web爬虫
|
5年多前
Ah_伟/TuchongPy
0
图虫爬虫
Python
Web爬虫
|
5年多前
galoS/17KSpider
10
17K小说网定向爬虫
Python
Web爬虫
|
6年多前
kzeng/picpicker
41
根据图书ISBN抓图书封面图片的小程序
Python
Web爬虫
|
6年多前
1
2
今日热门
本周热门
AJay13/ECommerceCrawlers
4.2K
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
liweimin/爬虫代码片段 拼多多,团油,抖店
26
pinduoduo店铺订单采集 caizhuang 彩妆网商品采集 tuanyou 团油油站油价采集 douyin 抖音店铺数据采集 往约app数据采集 快手视频批量上传 抖音视频批量上传 异步采集写真/头像 liweimin@taiyuan
博众科技/feapder
60
feapder是一款支持分布式、批次采集、任务防丢、报警丰富的python爬虫框架
DTC2/ECommerceCrawlers
434
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、闲鱼、阿里任务、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家️️️
AJay13/ECommerceCrawlers
4.2K
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
shengqiangzhang/examples-of-web-crawlers
472
一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )
沈阳程序员/Scrapy-Python
123
Scrapy:网站爬虫框架库抓取
小码编程/scrapy_zhaopin
229
基于Python和Echarts职位画像系统,使用Scrapy抓取职位招聘数据,使用Django+echarts完成数据可视化
liweimin/爬虫代码片段 拼多多,团油,抖店
26
pinduoduo店铺订单采集 caizhuang 彩妆网商品采集 tuanyou 团油油站油价采集 douyin 抖音店铺数据采集 往约app数据采集 快手视频批量上传 抖音视频批量上传 异步采集写真/头像 liweimin@taiyuan
fffonion/JJGet
30
晋江小说下载器 镜像自 https://github.com/fffonion/jjget
博众科技/feapder
60
feapder是一款支持分布式、批次采集、任务防丢、报警丰富的python爬虫框架
惊鸿一回车/WeChat_Article
162
爬取微信公众号文章
resolvewang/WeiboSpider
355
分布式微博爬虫。抓取内容包括微博用户资料、微博信息、评论信息和转发信息。目前专注于微博数据抓取本身,正在快速迭代。如果觉得有帮助,不妨到github上给我点个star,osc上可能不会再继续更新了
DTC2/ECommerceCrawlers
434
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、闲鱼、阿里任务、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家️️️
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
回到顶部