kettle学习

ETL简介:

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我要学习的ETL工具是Kettle!

Kettle简介:

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装数据抽取高效稳定

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么而不是你想怎么做

Kettle中有两种脚本文件,transformationjob,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle(现在已经更名为PDI,Pentaho Data Integration-Pentaho数据集成)。

学长给的下载链接:

Kettle-8.2下载地址链接:https://pan.baidu.com/s/1LIieWD6HuESzlRbrHSaW-A

提取码:n40v

【2019kettle8.2最新教程-哔哩哔哩】 https://b23.tv/q2i678B

kettle 8.2数据仓库零基础快速入门对应课程配套资源下载链接:

https://pan.baidu.com/s/1wT0F59wxuq72rCfvVN8xGg 提取码:77u3

Kettle部署:

1.下载Kettle

2.安装JDK,下载地址:https://www.oracle.com/cn/java/technologies/downloads/

3.配置环境变量:JAVA_HOME:JDK的安装目录 KETTLE_HOME:kettle的解压目录

编辑PATH环境变量

打开解压文件,打开data-integration文件目录,往下翻找到Spoon,双击打开就能使用Kettle了

jdbc下载地址:

https://dev.mysql.com/downloads/connector/j/

MySQL数据库学习:

10天精通MySQL 在线观看https://www.bilibili.com/video/BV1Kr4y1i7ru 资料链接:https://pan.baidu.com/s/1zQ0AQn68WaLvihEEiX312A?pwd=1234 提取码:1234

计算机硬件扫盲

1.硬件组成: 1.1CPU 计算机的计算与控制单元,有些时候会包含一些额外的集成组件,比如至强可扩展以P结尾的型号集成了一块fpga,苹果M1集成了内存与...

Docker入门

背景知识 容器技术的起源 假设你们公司正在秘密研发下一个“今日头条”APP,我们姑且称为明日头条,程序员自己从头到尾搭建了一套环境开始写代码,写完...

从零构建知识图谱技术方法与案例

前言 书中代码资源下载地址 https://github.com/zhangkai-ai/build-kg-from-scratch书签:https://github.com/zhangkai-ai/build-kg-from-scratch ...

神经网络简介

我们这里说的“神经网络”指人工神经网络,它是一种模仿生物神经网络结构和功能的计算模型。 以上是生物神经网络的示意图,以下是人工神经网络的示意图...

Linux常用命令

关机/重启/注销 常用命令作用shutdown -h now即刻关机shutdown -h 1010分钟后关机shutdown -h 11:0011:00关机shutdown -h +10预定时间关机(10分钟后)s...