在hive中使用parquet(CDH4.3)
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了在hive中使用parquet(CDH4.3),小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1719字,纯文字阅读大概需要3分钟。
内容图文
hadoop版本 cdh4.3 使用impala创建parquet表后,查询会出错。 [impala:21000] SELECT * FROM foo;Query: SELECT * FROM fooERROR: AnalysisException: Failed TO LOAD metadata FOR TABLE: DEFAULT.fooCAUSED BY: TableLoadingException: Failed TO LOAD met
hadoop版本 cdh4.3
使用impala创建parquet表后,查询会出错。
[impala:21000] > SELECT * FROM foo; Query: SELECT * FROM foo ERROR: AnalysisException: Failed TO LOAD metadata FOR TABLE: DEFAULT.foo CAUSED BY: TableLoadingException: Failed TO LOAD metadata FOR TABLE: foo CAUSED BY: MetaException: org.apache.hadoop.hive.serde2.SerDeException SerDe parquet.hive.serde.ParquetHiveSerDe does NOT exist
原因是hive并没有这些lib,下载它们并放入/opt/cloudera/parcels/CDH/lib/hive/lib目录(我是使用cloudera manager部署的),创建脚本下载
#!/bin/sh #parquet-pig parquet-scrooge parquet-test-hadoop2 parquet-thrift parquet-avro parquet-cascading ? for f in parquet-column parquet-common parquet-encoding parquet-generator parquet-hadoop parquet-hive do curl -O http://repo1.maven.org/maven2/com/twitter/${f}/1.2.4/${f}-1.2.4.jar #curl -O http://oss.sonatype.org/service/local/repositories/releases/content/com/twitter/${f}/1.2.4/${f}-1.2.4.jar done curl -O http://repo1.maven.org/maven2/com/twitter/parquet-format/1.0.0/parquet-format-1.0.0.jar
然后把他们拷贝进去
cp parquet-* /opt/cloudera/parcels/CDH/lib/hive/lib
可能要重启metastore,然后在impala中刷新metastore
INVALIDATE METADATA;
在impala修改parquet表
create table test2 (name STRING) STORED AS PARQUETFILE;
插入数据
insert into test2 select * from test;
参考
https://issues.cloudera.org/browse/IMPALA-574
原文地址:在hive中使用parquet (CDH4.3), 感谢原作者分享。
内容总结
以上是互联网集市为您收集整理的在hive中使用parquet(CDH4.3)全部内容,希望文章能够帮你解决在hive中使用parquet(CDH4.3)所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。