1.概要

KETTLE 是一个ETL工具,实现数据从多个异构数据源加载到数据库或其他目标地址。它有两种脚本transformation(转换)和Job(作业),我们平台将其集成,可配置资源库与作业、转换等,通过我们的任务调度中心实时执行脚本,下面简单介绍一下它是如何使用的。

2.下载与nacos配置

1.下载地址:https://nchc.dl.sourceforge.net/project/pentaho/Pentaho 9.1/client-tools/pdi-ce-9.1.0.0-324.zip
2.nacos的nacos-config.properties配置路径(实际按照需求定义)
    #kettle插件路径
    props.kettlePluginPath=D:/Redxun/kettle/data-integration/plugins
    #kettle文件上传路径
    props.kettleUploadPath=d:/temp2/

3.Kettle新增资源库

3.1.启动Kettle

Kettle目录下的data-integration中,双击Spoon.bat启动Kettle

3.2.新增资源库

数据库参数
命名参数
characterEncoding utf-8
serverTimezone GMT+8
注意事项
1.资源库默认账号密码都为admin
2.需要在kettlelib目录中增加驱动程序 mysql-connector-java-8.0.17.jar

3.3.配置资源库

注意事项
1.资源库的配置需要与kettle的同步

3.3.配置转换、作业

3.3.1.新增转换

3.3.2.新增作业

注意事项
乱码处理:编辑 spoon.bat
在if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-Dfile.encoding=UTF-8"中增加 "-Dfile.encoding=UTF-8"

3.4.配置kettle任务调度(需启动jpaas_job服务)

3.4.1.查看kettle任务执行器

注意事项
1.OnLine 机器地址为空时查看nacos的nacos-config-dev.properties
job.system=true

3.5.查看kettle任务调度日志记录


文档更新时间: 2022-04-07 11:55   作者:gaojiahao