2060071 atuptown 1705377369
211
基于flink的异构数据源流转系统🔥🔥
17小时前
6854763 mindspore 1604325217
35
MindSpore Pandas is a data analysis framework, which is compatible with Pandas interfaces and provides distributed processing capabilities.
Python
接近1年前
11655508 datavane 1687246411
266
人人都会用的数据集成产品,并提供一站式、开箱即用的 DataOps 数据中台,大幅提高ETL实时数仓构建效率
Java
24天前
11655508 datavane 1687246411
91
新一代数据可观测性系统,提供元数据管理和数据质量检查功能,让您心中有数!
Java
3天前
11655508 datavane 1687246411
280
新一代云原生大数据管家,旨在帮助用户快速构建起稳定、高效、可弹性伸缩的大数据云原生平台
Java
4天前
11
一个用于高性能工作负载场景下基于Kubernetes的容器批量调度引擎 Volcano是在Kubernetes上运行高性能工作负载的容器批量计算引擎。 它提供了Kubernetes目前缺少的一套机制,这些机制通常是许多高性能 工作负载所必需的,包括: - 机器学习/深度学习 - 生物学计算/基因计算 - 大数据应用
4个月前
12303739 baihai idp 1690958128
43
IDP 是一款面向数据科学家和大数据工程师的开源 AI IDE。
615
云雀 是一款数据集成工具,实现异构数据源的整合,帮助企业构建数据仓库、数据湖 等应用架构
Java
13天前
54
云原生大数据分析 Lakehouse 是一个兼容主流云厂商对象存储的一站式 Serverless 融合大数据处理分析服务,帮助用户快速进行数据湖探索,洞察业务价值。
Java
接近2年前
5162368 dromara 1664439580
252
CloudEon 将基于 Kubernetes 的资源安装部署开源大数据组件,实现开源大数据平台的容器化运行,您可减少对于底层资源的运维关注
12天前
58
罗盘是一个大数据任务诊断平台,旨在提升用户排查问题效率,降低用户异常任务成本。 其主要功能特性如下: 非侵入式,即时诊断,无需修改已有的调度平台,即可体验诊断效果。 支持多种主流调度平台,例如DolphinScheduler、Airflow或自研等。 支持多版本Spark、Hadoop 2.x和3.x 任务日志诊断和解析。 支持工作流层异常诊断,识别各种失败和基线耗时异常问题。
3个月前
7432900 zhijiangtianshu 1615537429
120
天枢可视分析平台是致力于探寻数据价值的大数据可视分析平台,支持多种类型和来源的数据接入,可高效进行交互式数据清洗、分析与挖掘,并实现高性能的数据可视化。用户可以进入天枢可视分析平台官网查看更多关于平台的介绍
10个月前
11439529 fire framework 1677489254
477
Fire框架是由中通大数据自主研发并开源的、专门用于进行Spark和Flink任务开发的大数据框架,可节约70%以上的代码量。首创基于注解进行Spark和Flink任务开发,具备实时血缘、根因诊断、动态调优、参数热调整等众多平台化功能。Fire框架在中通内部每天处理数据量高达数千亿,在外部已被数十家公司所使用。
Scala
6小时前
35
LakeSoul 端到端实时湖仓框架 Github 官方镜像 https://github.com/lakesoul-io/LakeSoul
Scala
25天前
8959543 dtstack dev 0 1650593715
500
基于flink的分布式数据同步框架
Java
11个月前

搜索帮助