文档详情

kettle使用手册答题.docx

发布:2017-04-19约1.75千字共24页下载文档
文本预览下载声明
Spoon.bat修改 在set opt=*最后 -Dfile.encoding=UTF-8,解决乱码问题 表输入 替换SQL语句中的变量:变量用 ‘?’ 表示 从步骤中插入数据:这个组件之前的流程名称 新建/编辑 Wizard(向导) 填写数据库连接名称(选择数据库连接类型和数据库访问类型)NEXT 端口号默认 NEXT 点击测试数据库连接 获取SQL查询语句 选择表或者视图,确定 也可以自定义SQL语句. 预览 查询 查询所需关键字:字段1为流入字段 查询返回的值:字段为数据库表字段,可以起个别名,类型不选可能导致跨库乱码 获取查询关键字:流入的所有字段 获取返回字段:所选数据库表所有字段 Switch/Case Switch字段:流入的字段 Case值数据类型:视情况而定 Case值:此处为空时-转到-查询DEPT_CODE 默认目标步骤(default):自定义流程,如图 字段选择 移除:移除流入字段 元数据:修改元数据字段 选择和修改: 如果指定了移除和元数据就不能选择列映射 增加常量 添加一列到元数据流中 设置字段值 替换流字段的值 表输出 主选项默认 不是临时表的话,千万不要选中剪裁表,这个用于删除表中的数据 勾选’指定数据库字段’后才能操作’数据库字段面板’ 提交记录数量:每次批处理的数量,一批对应一个事务 输入字段映射 不要随便点’猜一猜’ 空操作 什么也不做 删除 查询所需的关键字:删除的条件 插入/更新 不推荐使用 比较流中和数据库表的值,不同则更新 编辑映射:同表输出 字符串替换 过滤两个或以上中文并设置为空串 去除重复记录 注意:去除的记录要排序,否则只去除连续的值 行扁平化 详解:  HYPERLINK /Document/detail/tid/73025 /Document/detail/tid/73025 Access输入 选择mdb格式文件,支持正则过滤 Kettle增量更新  HYPERLINK /s/blog_6d35752501015dtm.html /s/blog_6d35752501015dtm.html 获取系统信息 类型 预览记录 计算器 如下是移除元数据流字段,新数据流加负号 Kettle变量 名称对应参数 值:可以写SQL函数,比如sysdate+1,to_date()等 相对应的变量名 位置对应参数 获取系统信息 此处添加两个变量作为增量的值 设置变量 变量活动类型: 2)?通过属性文件(常用) 在C:\Users\${userName}\.kettle\perties?中添加变量(key=value) Java?Virtual?Machine:S系统级作用域,凡是在一个java虚拟机下运行的线程都受其影响。 parent?job:在当前作业下是生效的。 grand-parent?job:在当前作业的父作业下是生效的。 the?root?job:R级作用域,凡是在跟作业下运行的都是生效的 变量替换SQL语句 勾选“替换 HYPERLINK /s?wd=SQL%E8%AF%AD%E5%8F%A5tncprfenlei=mv6quAkxTZn0IZRqIHckPjm4nH00T1dWrjRknAfdnh7bPWD4PHc30ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnHbdP16YP1TYPj6vPWR3nHDsn0 \t /_blank SQL语句里的变量“和”执行每一行“? 合并记录 比较两个数据源数据 关键字段:用于定位两个数据源中的同一记录 数据字段:比较的字段 标志字段:用于保存比较的结果 1. “identical” – 旧数据和新数据一样 2. “changed” – 数据发生了变化; 3. “new” – 新数据中有而旧数据中没有的记录 4. “deleted” –旧数据中有而新数据中没有的记录 过滤记录 过滤后的数据发送到false步骤 此处有掌声
显示全部
相似文档