5279207 webank 1578992666
811
将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出等数据应用开发全流程场景需求。欢迎申请体验demo环境:https://sandbox.webank.com/wds/dss/#/register
1 month ago
5053202 starblues 1578979249
339
轻量级/高性能/可插件扩展的ETL工具
4 months ago v1.1.0 updated on Jun 09 5 issues
235
基于原生kettle-6.1.0.1版本开发web版数据集成平台
1 year ago
4964548 guangzhou tipdm intelligence devp 1578977793
220
TipDM建模平台,开源的数据挖掘工具。
1 year ago 1 issue
146322 divenswu 1578919490
176
在数据仓库建设中,经常会使用到数据血缘追踪方面的功能,本项目实现了对hql集合进行静态分析,获取hql对应的血缘图(表血缘 + 字段血缘)
almost 2 years ago hive字段血缘-v1.1.0 updated on Jan 02 1 issue
6892317 apache 1605059459
156
Apache Flink 是高效和分布式的通用数据处理平台
23 days ago
5279207 webank 1578992666
139
Qualitis是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。 Qualitis基于Spring Boot,依赖于Linkis进行数据计算,提供数据质量模型构建,数据质量模型执行,数据质量任务管理,异常数据发现保存以及数据质量报表生成等功能。并提供了金融级数据质量模型资源隔离,资源管控,权限隔离等企业特性,具备高并发,高性能,高可用的大数据质量管理能力。
3 months ago 1 issue
5997794 openlookeng 1598665874
91
openLooKeng is a drop in engine which enables in-situ analytics on any data, anywhere, including geographically remote data sources.
20 hours ago 120 issues
5460443 baidu 1578992824
75
Apache Doris (incubating)(原Palo)是一款百度大数据团队自主研发的MPP数据库
22 days ago
319685 bboss 1578989326
62
数据交换模块
2 hours ago Easticsearch数据同步工具v6.2.5发布 updated on Dec 04
55
Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用.
almost 4 years ago
46
Apache Spark的性能表现受到配置参数的影响,这些参数的调优往往由人力完成,然而不适当的参数配置可能严重地降低系统的性能表现。 本工具能够根据历史记录自动调整Apache spark的参数设置
1 year ago
34
Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。
11 days ago
963383 idela hp 1578936904
27
该地址更新缓慢,可以移步https://gitee.com/mirrors/Sylph
1 year ago
25
OSSEAN是一个全球开源软件实时分析监测系统,通过对全球主流开源社区进行持续数据实时采集和跨社区深度关联分析,提供开源项目检索、评估和排行等服务。
1 month ago 1 issue

Search