15
COOPER 平台通过分析软件开发者大数据对开发者进行全方位画像和协作关系分析,并构建软件开发者知识图谱,在此基础上提供开发者和开发资源的智能搜索与推荐服务
2 months ago
25
OSSEAN是一个全球开源软件实时分析监测系统,通过对全球主流开源社区进行持续数据实时采集和跨社区深度关联分析,提供开源项目检索、评估和排行等服务。
1 month ago 1 issue
18
一门面向大数据和AI的语言 一个真正整合数据管理,商业分析,机器学习的统一平台
18 days ago
5997794 openlookeng 1598665874
91
openLooKeng is a drop in engine which enables in-situ analytics on any data, anywhere, including geographically remote data sources.
12 hours ago 120 issues
5053202 starblues 1578979249
339
轻量级/高性能/可插件扩展的ETL工具
4 months ago v1.1.0 updated on Jun 09 5 issues
5279207 webank 1578992666
139
Qualitis是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。 Qualitis基于Spring Boot,依赖于Linkis进行数据计算,提供数据质量模型构建,数据质量模型执行,数据质量任务管理,异常数据发现保存以及数据质量报表生成等功能。并提供了金融级数据质量模型资源隔离,资源管控,权限隔离等企业特性,具备高并发,高性能,高可用的大数据质量管理能力。
3 months ago 1 issue
235
基于原生kettle-6.1.0.1版本开发web版数据集成平台
almost 1 year ago
5279207 webank 1578992666
811
将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出等数据应用开发全流程场景需求。欢迎申请体验demo环境:https://sandbox.webank.com/wds/dss/#/register
1 month ago
5460443 baidu 1578992824
75
Apache Doris (incubating)(原Palo)是一款百度大数据团队自主研发的MPP数据库
22 days ago
46
Apache Spark的性能表现受到配置参数的影响,这些参数的调优往往由人力完成,然而不适当的参数配置可能严重地降低系统的性能表现。 本工具能够根据历史记录自动调整Apache spark的参数设置
1 year ago
4964548 guangzhou tipdm intelligence devp 1578977793
220
TipDM建模平台,开源的数据挖掘工具。
1 year ago 1 issue
963383 idela hp 1578936904
27
该地址更新缓慢,可以移步https://gitee.com/mirrors/Sylph
1 year ago
146322 divenswu 1578919490
176
在数据仓库建设中,经常会使用到数据血缘追踪方面的功能,本项目实现了对hql集合进行静态分析,获取hql对应的血缘图(表血缘 + 字段血缘)
almost 2 years ago hive字段血缘-v1.1.0 updated on Jan 02 1 issue
34
Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。
11 days ago
319685 bboss 1578989326
11
this is a db-hdfs tools used to transfer big database datas to hadoop hdfs like sqoop,but bboss bigdata tool is very nice monitor and event drivered model,and high perfermance,support Distributed executor tasks Ability.
almost 2 years ago

Search