首页 / HADOOP / hadoop-sqoop学习笔记

hadoop-sqoop学习笔记

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了hadoop-sqoop学习笔记，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含940字，纯文字阅读大概需要2分钟。

内容图文

======导入====

sqoop import --connect jdbc:mysql://20.12.20.165:3306/luo0907 --username root --password 12345 --table aa01 --fields-terminated-by ‘\t‘ -m 1 --hive-import

sqoop import --connect jdbc:mysql://20.12.20.165:3306/luo0907 --username root --password 12345 --table aa01 --fields-terminated-by ‘\t‘ -m 1 --hive-import --hive-overwrite --create-hive-table --hive-table luo0908.aa01 --delete-target-dir
sqoop import --connect jdbc:mysql://20.12.20.165:3306/luo0907 --username root --password 12345 --table aa01 --target-dir /luo2/luo01 ###要用hdfs用户执行

GRANT ALL PRIVILEGES ON *.* TO ‘root‘@‘%‘ IDENTIFIED BY ‘12345‘ WITH GRANT OPTION;
hadoop fs -chown root:hdfs /tmp/test.txt

=====导出=====
sqoop export --connect jdbc:mysql://20.12.20.165:3306/luo0907 --username root --password 12345 --table aa01 --export-dir ‘/user/hive/warehouse/luo0908.db/aa01‘ --fields-terminated-by ‘\t‘

原文：http://www.cnblogs.com/luo-mao/p/5872411.html

内容总结

以上是互联网集市为您收集整理的hadoop-sqoop学习笔记全部内容，希望文章能够帮你解决hadoop-sqoop学习笔记所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1099965.html

来源：【匿名】

【上一篇】hadoop_集群安装_1 【下一篇】php能用hadoop吗

更多 ►

【hadoop-sqoop学习笔记】教程文章相关的互联网学习教程文章

Hadoop学习笔记系列文章导航【图】

一、为何要学习Hadoop?　　这是一个信息爆炸的时代。经过数十年的积累，很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一，怎样从累积的数据里寻找价值，变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据，如果求助于昂贵的专用主机甚至超级计算机，成本无疑很高，有时即使是保存数据，也需要面对高成本的问题，因为具有海量数据容量的存储设备，价格往往也是...

第133讲：Hadoop集群监控Ganglia架构设计和运行机制详细解析学习笔记

第133讲：Hadoop集群监控Ganglia架构设计和运行机制详细解析学习笔记可监控和显示集群中节点的各种状态信息，如CPU/内存、磁盘利用率，IO负载，网络流量等。ganglia可将历史数据以曲线形式非常友好地以php页面形式展现，本身有很好的扩展性，允许用户加入自己想监控的信息。要监控特殊信息时方便。下图是ganglia架构图: ganglia包含几个部分，这几个部分间通信是通过xdl或xml格式传递监控数据。集群中的节点会运行gmond收集节点状态...

hadoop学习笔记（三）：hdfs常用命令【代码】

一、hadoop fs1、创建目录[root@master hadoop-2.7.0]# hadoop fs -mkdir /testdir1 [root@master hadoop-2.7.0]# hadoop fs -ls / Found 2 items drwxr-xr-x - root supergroup 02018-05-0711:27 /test drwxr-xr-x - root supergroup 02018-05-1809:27 /testdir1加 -p 则创建多级目录[root@master hadoop-2.7.0]# hadoop fs -mkdir -p /aa/bb/cc [root@master hadoop-2.7.0]# hadoop fs -ls / Found 3 item...

Hadoop学习笔记（一）—hadoop2.5.2+zookeeper3.6.4+centosx64+vmware11环境搭建【代码】【图】

前言大数据实在是太热，一直对新技术充满着向往，其实hadoop也不是新技术，已经好几年了。打算学习，一下hadoop整个生态圈的内容。这篇文章介绍一下环境搭建，自己搭环境摸索了好几天连着，终于搭建完成，记录一下。并share一下，如果哪天你也需要，大家一起共勉。在这希望...

Hadoop学习笔记(3)——分布式环境搭建【图】

Hadoop学习笔记(3) ——分布式环境搭建前面，我们已经在单机上把Hadoop运行起来了，但我们知道Hadoop支持分布式的，而它的优点就是在分布上突出的，所以我们得搭个环境模拟一下。在这里，我们采用这样的策略来模拟环境，我们使用3台ubuntu机器，1台为作主机(master)，另外2台作为从机(slaver)。同时，这台主机，我们就用第一章中搭建好的环境来。我们采用与第一章中相似的步骤来操作: 运行环境搭建在前面，我们知道，运行hadoo...

Hadoop源码学习笔记之NameNode启动流程分析二：http server启动源码剖析【代码】【图】

NameNodeHttpServer启动源码剖析，这一部分主要按以下步骤进行：　　一、源码调用分析　　二、伪代码调用流程梳理　　三、http server服务流程图解第一步，源码调用分析　　前一篇文章已经锁定到了NameNode.java类文件，搜索找到main()，可以看到代码只有寥寥几行，再筛除掉一些参数校验以及try-catch逻辑代码，　　剩下的核心的代码甚至只有两行，如下： 1publicstaticvoid main(String argv[]) throws Exception {2if (DFSUtil.p...

Hadoop学习笔记—17.Hive框架学习【图】

一、Hive：一个牛逼的数据仓库1.1 神马是Hive？　　Hive 是建立在 Hadoop 基础上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer...

Hadoop 学习笔记1【图】

1. Hadoop 最出名的是 MapReduce和 HDFS，不过也有很多其他有用的子项目。技术栈如下： Core 一系列分布式文件系统和通用I/O的组件和接口（序列化、Java RPC和持久化数据结构）Avro 一种提供高效、跨语言RPC的数据序列系统，持久化数据存储。MapReduce 分布式数据处理模式和执行环境，运行于大型商用机集群。HDFS 分布式文件系统，运行于大型商用机集群。Pig 一种数据流语言和运行环境，用以检索非常大的数据集。...

Hadoop学习笔记之Hadoop伪分布式环境搭建

搭建为伪分布式Hadoop环境1、宿主机（Windows）与客户机（安装在虚拟机中的Linux）网络连接。a) Host-only 宿主机与客户机单独组网；好处：网络隔离；坏处：虚拟机和其他服务器之间不能通讯；b) Bridge 桥接宿主机与客户机在同一个局域网中。好处：窦在同一个局域网，可以互相访问；坏处：不完全。2、Hadoop的为分布式安装步骤a) 设置静态IP在centos下左面上右上角图标右键修改；重启网卡service network restart;验证：执行命令i...

Hadoop学习笔记（三）——zookeeper的一致性协议：ZAB

ZAB：ZooKeeper的Atomic Broadcast协议，能够保证发给各副本的消息顺序相同。Zookeeper使用了一种称为Zab（ZookeeperAtomic Broadcast）的协议作为其一致性复制的核心，其特点为高吞吐量、低延迟、健壮、简单，但不过分要求其扩展性。 Zookeeper的实现是有Client、Server构成，Server端提供了一个一致性复制、存储服务，Client端会提供一些具体的语义，比如分布式锁、选举算法、分布式互斥等。从存储内容来说，Server端更多的是存储...

hadoop学习笔记

map函数执行结束后，map输出的<k, v>一共有4个，分别是<hello, 1><you, 1>,<hello, 1>,<me, 1>分区，默认只有一个分区排序 <hello, 1>,<hello, 1>,<me, 1><you, 1>分组把相同key的value放到一个集合中 <hello, {1,1}><me, {1}><you, {1}>，每一组调用一次reduce函数归约（可选）map任务输出的临时结果存放在linux磁盘上。原文：http://my.oschina.net/sniperLi/blog/364008

hadoop1.0.3学习笔记【代码】【图】

回到目录最近要从网上抓取数据下来，然后hadoop来做存储和分析。每晚尽量更新呆毛王赛高月子酱赛高小唯酱赛高目录安装hadoop1.0.3HDFSwordcountmapreduce去重mapreduce算平均分mapreduce排序安装hadoop1.0.3 1 ubuntu中安装hadoop 1.0.32 ------------伪分布式安装-------------3 1.安装ssh4 sudo apt-get install openssh-server5 如果出现E:Could not open lock file /var/lib/dpkg/lock6 可能是前...

hadoop学习笔记2---hadoop的三种运行模式

1、单机模式安装简单，在一台机器上运行服务，几乎不用做任何配置，但仅限于调试用途。没有分布式文件系统，直接读写本地操作系统的文件系统。2、伪分布式模式在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondary namenode等进程，模拟分布式运行的各个节点。配置已经很接近完全分布式。3、完全分布式模式正常的Hadoop集群，由多个各司其职的节点构成。原文：http://blog.51cto.com/xiaoxiaozhou/2128670

Hadoop学习笔记0002——HDFS文件操作

Hadoop学习笔记0002——HDFS文件操作说明：Hadoop之HDFS文件操作常有两种方式，命令行方式和JavaAPI方式。方式一：命令行方式Hadoop文件操作命令形式为：hadoop fs -cmd <args>说明：cmd是具体的文件操作命令，<args>是一组数目可变的参数。Hadoop最常用的文件操作命令，包括添加文件和目录、获取文件、删除文件等。 1 添加文件和目录HDFS有一个默认工作目录/usr/$USER，其中$USER是你的登录用户名，作者的用户名是root。该目录不...