使用Talend Open Studio将数据从oracle导入到hive中
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了使用Talend Open Studio将数据从oracle导入到hive中,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含3413字,纯文字阅读大概需要5分钟。
内容图文
file.zip jobInfo.properties join lib [hive@h1 work]$ cd join/ [hive@h1 join]$ ls bigdatademo items join_0_1.jar join_run.bat join_run.sh src user_activity2 [hive@h1 join]$ pwd /home/work/join [hive@h1 join]$ ls bigdatademo items join_0_1.jar join_run.bat join_run.sh src user_activity2 [hive@h1 join]$ pwd /home/work/join [hive@h1 join]$ ./join_run.sh > user_activity2 2>&1 &这样就得到了SQL语句执行的结果,存放在user_activity2中。
hive建表语句:
hive> show create table user_activity2; OK CREATE TABLE `user_activity2`( `user_id` string, `user_name` string, `sex` string, `age` string, `reg_hosp` string, `reg_community` string, `type` string, `disease_code` string, `disease` string, `doctor` string, `hosp_name` string, `service_id` string, `drug_id` string, `drug_name` string, `antibiotic` string, `hormone` string, `source` string, `base_drug` string, `community` string, `date` string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘|‘ STORED AS INPUTFORMAT ‘org.apache.hadoop.mapred.TextInputFormat‘ OUTPUTFORMAT ‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat‘ LOCATION ‘hdfs://h1:8020/apps/hive/warehouse/cyw.db/user_activity2‘ TBLPROPERTIES ( ‘transient_lastDdlTime‘=‘1435547544‘) Time taken: 0.288 seconds, Fetched: 31 row(s)
将数据导入到hive表中:load data local inpath ‘./user_activity2‘ into table user_activity2;
hive> show tables; OK Time taken: 0.794 seconds hive> use cyw; OK Time taken: 0.256 seconds hive> show tables; OK user_activity user_activity2 Time taken: 0.136 seconds, Fetched: 2 row(s) hive> load data local inpath ‘./user_activity2‘ into table user_activity2; Loading data to table cyw.user_activity2 Table cyw.user_activity2 stats: [numFiles=1, totalSize=216927483] OK Time taken: 10.898 seconds hive> select * from user_activity2; OK F805418B-335F-4CA3-A209-7C9655148146 余泽英 2 47 成都高新区合作社区卫生服务中心 合作 1 急性支气管炎 谭万龙 成都高新区合作社区卫生服务中心 1E972231-C65A-4CE3-9233-8EA1B18058DE 灭菌注射用水 d875aacf-4723-4777-91ec-12d63732b58f 0 0 其他 合作 2014-02-27 F805418B-335F-4CA3-A209-7C9655148146 余泽英 2 47 成都高新区合作社区卫生服务中心 合作
查询语句:
select a.个人id, b.姓名, b.性别, round((sysdate - b.出生日期) / 365) as fage, b.建档单位, replace(replace(replace(b.建档单位, ‘高新区‘), ‘社区卫生服务中心‘), ‘成都‘) 建档社区, 1 as ftype, a.问题编码, a.问题名称, a.处理医生, c.机构名, a.服务记录id, f.名称, f.id 药品ID , f.抗生素, f.激素类药, case when f.药品来源 is null then ‘其他‘ else f.药品来源 end 药品来源, f.基药分类, replace(replace(replace(c.机构名, ‘高新区‘), ‘社区卫生服务中心‘),‘成都‘) 诊疗社区, to_char(a.发现日期, ‘yyyy-mm-dd‘) 诊疗日期 from ZLCHS.个人问题列表 a, ZLCHS.个人信息 b, ZLCHS.服务活动记录 c, (select d.事件id, e.名称, e.id, h.药品来源, h.基药分类, g.抗生素, g.激素类药 from ZLCHS.个人费用记录 d, ZLCHS.收费项目目录 e, ZLCHS.药品规格 h, ZLCHS.药品特性 g where d.收费项目id = e.id and d.收据费目 in (‘西药费‘, ‘中草药费‘, ‘中成药费‘) and h.药品id(+) = e.id and h.药名id = g.药名id) f where a.个人id = b.id(+) and a.服务记录id = c.id(+) and a.服务记录id = f.事件id(+)
使用Talend Open Studio将数据从oracle导入到hive中
标签:
本文系统来源:http://www.cnblogs.com/justinzhang/p/4607331.html
内容总结
以上是互联网集市为您收集整理的使用Talend Open Studio将数据从oracle导入到hive中全部内容,希望文章能够帮你解决使用Talend Open Studio将数据从oracle导入到hive中所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。