码云 Gitee IDE 全新上线——支持 Git 管理的轻量在线编码环境
Vip_title

GVP (Gitee Most Valuable Projects) - 码云最有价值开源项目计划

是码云综合评定出的优秀开源项目的展示平台

加入GVP计划

hmily

Java
高性能异步分布式事务TCC框架

myth

Java
采用消息队列解决分布式事务的开源框架, 基于java语言来开发(JDK1.8),支持dubbo,springcloud,motan等rpc框架进行分布式事务。

Roses

Java
Roses基于Spring Boot 2和Spring Cloud Finchley.RELEASE,更符合企业级的分布式和服务化解决方案,Roses拥有高效率的开发体验,提供可靠消息最终一致性分布式事务解决方案,提供基于调用链的服务治理,提供可靠的服务异常定位方案(Log + Trace)等等,一个分布式框架不仅需要构建高效稳定的底层开发框架,更需要解决分布式带来的种种挑战!

arthas

Java
Arthas(阿尔萨斯)是阿里巴巴开源的 Java 诊断工具

Per.js

JavaScript
快速、简便的响应式JavaScript开发框架

SequoiaDB

C++
SequoiaDB(巨杉数据库)是一款支持SQL、高并发、实时性、分布式、可扩展、灵活存储的操作型NewSQL数据库(Operational NewSQL Database)。
查看全部GVP项目
117_l-weiwei
强力 Java 爬虫,列表分页、详细页分页、ajax、微内核高扩展、配置灵活
Java Web爬虫
4个月前
471_flashsword20

黄亿华/webmagic

GVP
webmagic 是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。
Java Web爬虫 Apache-2.0
11个月前
329436_xiyoumc
全球最大成人网站PornHub爬虫 (Scrapy、MongoDB) 一天500w的数据
Python Web爬虫 MIT
8个月前
666978_xtuhcy

xtuhcy/Gecco

GVP
Gecco 是一款用java语言开发的轻量化的易用的网络爬虫,整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架。
Java Web爬虫 MIT
3个月前
117_l-weiwei

自风/Spiderman2

GVP
二代蜘蛛侠,此版本完全重新开发,比上一代更加强大(性能,易用,架构,分布式,简洁,成熟)
分布式爬虫系统,简单使用,高级配置。可扩展,减轻开发量,能docker化,适应各种急切需求核心框架:WebMagic, Spring Boot ,MongoDB, ActiveMQ ,Spring + Quartz,Spring Jpa , Druid,Redis, Ehcache ,SLF4J、Log4j2, Bootstrap + Jquery 等,不详细列举了
Java Web爬虫 LGPL-3.0
10个月前
429922_mail_osc
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
13016_dreamidea
牛咖-neocrawler nodejs 的爬虫系统。 特点: 支持web界面方式的摘取规则配置(css selector & regex); 包含无界面的浏览器引擎(phantomjs),支持js产生内容的抓取; 用http代理路由的方式防止抓取并发量过大的情况下被对方屏蔽; nodejs none-block 异步环境下的抓取性能比较高; 中央调度器负责网址的调度(同一时间片内一定数量的抓取任务中根据网站的权重来决定派发任务量; 支持多种抓取实例并存,定制摘取引擎和存储方式。
357525_zongtui
基于hadoop思维的分布式网络爬虫。
Java Web爬虫 MIT
2年多前
49322435918264
专门用来解决爬虫采集相关网站数据时模拟自动登录,验证码自动识别的问题;欢迎加入一起开发完善。
Java Web爬虫
4个月前
365569_jiangwl
多线程知乎用户爬虫,基于python3
Python Web爬虫
10个月前
Go语言实现的高性能爬虫,基于go_spider开发。实现了单机并发采集,深度遍历,自定义深度层级等特性。
Go Web爬虫 MPL-2.0
3年多前
1200611_coodyer
一款URL网址采集工具。支持自定义采集规则以适配不同搜索引擎
C# Web爬虫
3天前
zhihu-crawler是一个基于Java的爬虫实战项目,主要功能是抓取知乎用户的基本资料。
Java Web爬虫 Apache-2.0
12个月前
通过一个实际的项目,来学习如何使用scrapy爬取网络上的信息。这里以豆瓣小组为例,对组内的图片进行爬取,相关信息保存数据到MongoDB,图片下载到本地。
Python Web爬虫 MIT
2个月前
550473_ecitlm
基于nodejs 的爬虫 API接口项目,包括前端开发日报、知乎日报、前端top框架排行、妹纸福利、搞笑视频、各类视频新闻资讯 热点详情接口数据
NodeJS Web爬虫 GPL-2.0
6个月前
A java crawler for infomation collection.
Java Web爬虫 GPL-3.0
3个月前
204037726835871
用JavaFX开发基于crawler4j的图形化的网络爬虫
Java Web爬虫 MIT
5个月前
1033170_resolvewang
分布式微博爬虫。抓取内容包括微博用户资料、微博信息、评论信息和转发信息。目前专注于微博数据抓取本身,正在快速迭代。如果觉得有帮助,不妨到github上给我点个star,osc上可能不会再继续更新了
Python Web爬虫 MIT
1年前
一款分布式爬虫平台,帮助你更好的管理和开发爬虫。 内置一套爬虫定义规则(模版),可使用模版快速定义爬虫,也可当作框架手动开发爬虫
Go Web爬虫
10个月前
21346_smiledog
一个基于Spring+SpringMVC+Mybatis+webmagic+extjs开发的段子图片抓取平台
92024_kidd_yu
Beanbun 是用 PHP 编写的多进程网络爬虫框架,支持分布式,具有良好的开放性、高可扩展性,基于 Workerman。
PHP Web爬虫 MIT
11个月前
454392_virjar
适合抓取封堵的爬虫框架
基于bootstrap的php小说采集系统
PHP Web爬虫
1年多前
webmagicx一款基于webmagic的可配置化的爬虫框架
Scala Web爬虫
7个月前

Coody/Coody Framework

国产分布式IOC框架、已实现IOC、AOP、定时任务、切面缓存、MVC、事务管理。带一套轻量ORM,已登录Maven中央仓库。

吉海科技/Jshop小程序商城

Jshop小程序商城,是一款开源的电商系统,为中小企业提供最佳的新零售解决方案。后台采用Thinkphp5.1框架开发,执行...

shuaiqiyu/Raincat

2阶段提交分布式事务中间件(Implement by 2 pc)

曹二众/jeewms

wms 仓库管理系统,加QQ群:335607153

小滕/MeEdu

MeEdu 是一个基于Laravel开发的在线点播系统,寄托了我对当前知识付费领域的期望。我相信未来的每位身负技能的人都可以...

老花生/Open-Shop

Open-Shop是一个代码全部开源的微信小程序商城。经过严格测试无bug版本,可以直接使用。如需帮助请加qq群:87761...

曹二众/jeewms

wms 仓库管理系统,加QQ群:335607153

Coody/Coody Framework

国产分布式IOC框架、已实现IOC、AOP、定时任务、切面缓存、MVC、事务管理。带一套轻量ORM,已登录Maven中央仓库。

shuaiqiyu/hmily

高性能异步分布式事务TCC框架

stylefeng/Guns

Guns基于SpringBoot 2,致力于做更简洁的后台管理系统,完美整合springmvc + shiro + myba...

搜索帮助