1.概要
KETTLE 是一个ETL工具,实现数据从多个异构数据源加载到数据库或其他目标地址。它有两种脚本transformation(转换)和Job(作业),我们平台将其集成,可配置资源库与作业、转换等,通过我们的任务调度中心实时执行脚本,下面简单介绍一下它是如何使用的。
2.下载与nacos配置
1.下载地址:https://nchc.dl.sourceforge.net/project/pentaho/Pentaho 9.1/client-tools/pdi-ce-9.1.0.0-324.zip
2.nacos的nacos-config.properties配置路径(实际按照需求定义)
#kettle插件路径
props.kettlePluginPath=D:/Redxun/kettle/data-integration/plugins
#kettle文件上传路径
props.kettleUploadPath=d:/temp2/
3.Kettle新增资源库
3.1.启动Kettle
在Kettle目录下的data-integration中,双击Spoon.bat启动Kettle
3.2.新增资源库
数据库参数
命名参数 | 值 |
---|---|
characterEncoding | utf-8 |
serverTimezone | GMT+8 |
注意事项
1.资源库默认账号密码都为admin
2.需要在kettle的lib目录中增加驱动程序 mysql-connector-java-8.0.17.jar
3.3.配置资源库
注意事项
1.资源库的配置需要与kettle的同步
3.3.配置转换、作业
3.3.1.新增转换
3.3.2.新增作业
注意事项
乱码处理:编辑 spoon.bat
在if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-Dfile.encoding=UTF-8"中增加 "-Dfile.encoding=UTF-8"
3.4.配置kettle任务调度(需启动jpaas_job服务)
3.4.1.查看kettle任务执行器
注意事项
1.OnLine 机器地址为空时查看nacos的nacos-config-dev.properties
job.system=true
3.5.查看kettle任务调度日志记录
文档更新时间: 2022-04-07 11:55 作者:gaojiahao