Kettle官方版是一款用于数据集成和处置的开源ETL工具。Kettle官方版提供了直观的图形化界面和丰富的数据处置组件,用户可以轻松地从不同数据源中提取数据、进行转换和加载到目的系统中。Kettle官方版支持多种数据格式和数据库,包含CSV、Excel、MySQL、Oracle等,可应用于各种数据集成场景。
Kettle基本介绍
kettle是一款使用纯java撰写的叫做水壶的软件,不仅能够在windows 平台上运行,还可以在Linux、Unix上运行,kettle包括了Spoon、Kitchen、Pan三个组件,假如你需要在电脑上用kettle软件的话需要安装java才能正常用哦。
Kettle软件特点
开源系统的ETL专用工具,纯java写作;
翠绿色不需要安裝,数据抽取高效率平稳;
可以在Window、Linux、Unix上运作,平稳顺畅;
集群容许转换及其转换中的步骤在好几个互联网服务器上高并发实行;
可以用于完成数据信息的剖析、清理、校检、抽取、转换和载入等各种常见的ETL类工作中;
数据处置功能也非常强劲,特别合适于各种各样数据处置功能。
Kettle用法
打开kettle
第一解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
然后打开Spoon.bat,如图所示:
打开后请耐心等待一会儿时间。
打造转换。
在文件-》新建装换。
新建转换后在左侧的主对象树中打造DB连接用以连接数据库。如图所示:
打造数据库连接的过程与其他数据库管理系统连接数据库类似。
注意:在数据库链接的过程中,Kettle Spoon官方版或许会报某个数据库连接找不到的异常。那是由于你没对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
简单的数据表插入更新
新建表插入
在左侧的面板中选择核心对象,在核心对象里面选择输入-》表输入,用鼠标拖动到右侧面板。如图所示:
双击拖过来的表,可以编辑表输入。
选择数据库连接和编辑sql语句,在这一步可以点击预览,查询自己是不是连接正确。
通过插入更新输出到表。
在左侧面板中选择核心对象、选择输出-》插入更新如图所示:
编辑插入更新:
第一:表输入连接插入更新。
选中表输入,按住shift键,拖向插入更新。
然后:双击插入更新,编辑它。
到这里基本上,这个转换就要做完了,可以点击运行Kettle Spoon中文版查询成效,看是不是有误,这个要先保存了才能运行,可以随便保存到任何一个地方。
用作业控制上面装换实行。
用作业可以定时或周期性的实行转换,新建一个作业。并从左侧面板拖入start 和转换。
双击start可以编辑,可以设置实行时间等等。
点开装换,可以设置需要实行的转换任务,譬如可以实行上面大家做的转换,XXX.ktr,
最后点击运行即可。
Kettle更新日志
优化的性能和可扩展性
远程监控和实行转换
优化的价格算法
在步骤中离别构造/所有者和表名
数据库连接池支持
集群支持
数据库分区支持
很多的内存和性能优化
增强的数据库支持