首页 / MYSQL / Hive创建外部表以及分区
Hive创建外部表以及分区
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Hive创建外部表以及分区,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1561字,纯文字阅读大概需要3分钟。
内容图文
![Hive创建外部表以及分区](/upload/InfoBanner/zyjiaocheng/563/db69837d734642fab185d1075c166403.jpg)
创建带分区的外部表 创建外部表的好处是数据可以随时从hdfs中挂载进表中 使用分区的好处是可以缩短查询范围 下面的例子展示了如何创建外部表 CREATE EXTERNAL TABLE my_daily_report( last_update string, col_a string, col_b string, col_c string, col_d
创建带分区的外部表
创建外部表的好处是数据可以随时从hdfs中挂载进表中
使用分区的好处是可以缩短查询范围
下面的例子展示了如何创建外部表
CREATE EXTERNAL TABLE my_daily_report( last_update string, col_a string, col_b string, col_c string, col_d string, col_e string, col_f string, col_g string, col_h string, col_i string, col_j string) PARTITIONED BY ( par_dt string) location '/user/chenshu/data/daily';
挂载分区目录
alter table my_daily_report add partition (par_dt='20140530') location '/user/chenshu/data/daily/my_daily_report/20140530';
上面的例子只使用了一个分区,其实还可以使用多个分区,比如一个分区管理日报表,这个分区对应一个目录,在这个目录下还可以有小时分区,用不同的目录存放不同小时的报表。这时,分区之间的关系就是目录树的关系。
删除分区
当然也要提供一个删除part_dt='20140530'分区的方法:
alter table my_daily_report drop partition (par_dt='20140530')
drop partition会将分区以及数据都删除,drop partition_spec会只删除分区元数据,不删除数据。
注意,HIVE中没有delete from语句,如果仅仅是删除某个分区里所有语句,刚好这里可以使用drop partition来实现。
用分区查询
既然有了分区,如果紧要查找该分区上的数据,在where中指定分区目录作为查询条件,要快很多
select count(*) from my_daily_report where par_dt='20140531';推荐文章:
http://my.oschina.net/leejun2005/blog/82065
内容总结
以上是互联网集市为您收集整理的Hive创建外部表以及分区全部内容,希望文章能够帮你解决Hive创建外部表以及分区所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。