本文描述如何通过ODI将Oracle表数据同步到Hive。
1、准备工作
在hadoop集群的各个节点分别安装Oracle Big Data Connectors,具体的组件如下图所示:
这里只需安装Oracle Loader For Hadoop(oraloader)以及Oracle SQL Connector for Hadoop Distributed File System (oraosch)两个软件。安装比较简单,直接解压即可使用(这里的ODI、oraosch以及oraloader组件都是以oracle用户身份安装的。)
2、创建目标表
在Hive上创建目标表,如下:
CREATE TABLE `RHNPACKAGE2`( `id` bigint,
`org_id` bigint,
`name_id` bigint,
`evr_id` bigint,
`package_arch_id` bigint,
`package_group` bigint,
`rpm_version` string,
`description` string,
`summary` string,
`package_size` bigint,
`payload_size` bigint,
`installed_size` bigint,
`build_host` string,
`build_time` timestamp,
`source_rpm_id` bigint,
`checksum_id` bigint,
`vendor` string,
`payload_format` string,
`compat` bigint,
`path` string,
`header_sig` string,
`copyright` string,
`cookie` string,
`last_modified` timestamp,
`created` timestamp,
`header_start` bigint,
`header_end` bigint,
`modified` timestamp);
3、创建映射
之前已经创建好oracle和hive模型,这里直接使用其创建映射。如下图所示:
Integration Type设置属性:
连接设置属性:
过滤设置属性:
LKM设置属性:
IKM设置属性:
如果设置TRUNCATE的值为True,每次导入之前,会把表里的数据清空再导入,默认为false。
4、执行映射
结果如下图:
运维网声明
1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网 享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com