代码拉取完成,页面将自动刷新
ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。用户从数据源抽取出所需的数据,经过数据清洗和转换,最终形成所需的数据仓库,可用于进行数据统计分析,做商业决策等 。本项目使用开源ETL工具kettle实现一些常用的功能进行演示。
查询和连接:包含数据流的查询、连接查询有关的组件。
脚本:包含自定义脚本的使用,脚本可以用代码向数据流添加变量。
输入和输出: 任何流程必备输入输出组件,输入组件用于把文件或表数据产生数据流到流程中,输出组件用于将数据流中的数据写入到表或者文件。
应用和流程: 给流程提供一些高级应用或者控制流程状态的操作。
转换: 提供数据流的转换处理功能。包括计算器、值映射等。
购买地址 |
---|
标题 | 技术领域 | |
---|---|---|
1 | 一种基于微服务架构的车联网大数据分析系统 | 微服务 |
2 | 一种流式数据场景下Elasticsearch索引的自动化扩容方法 | 搜索引擎 |
3 | 大数据钻取分析方法、装置、设备及存储介质 | 大数据分析 |
4 | 一种基于工作流引擎的自动化办公方法和系统 | 工作流引擎 |
5 | 一种低延迟高性能实时数据仓库搭建的方法和系统 | 实时数仓 |
6 | 一种基于数据治理的大数据中台架构系统 | 数据中台 |
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
1. 开源生态
2. 协作、人、软件
3. 评估模型