首页 / HADOOP / hadoop-矩阵相乘法（MapReduce学习）

hadoop-矩阵相乘法（MapReduce学习）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了hadoop-矩阵相乘法（MapReduce学习），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含8908字，纯文字阅读大概需要13分钟。

内容图文

            列行相乘法：参见高度可伸缩的稀疏矩阵乘法_吴志川.pdf
package
             org.bigdata508.util;


            import
             java.io.IOException;


            import
             org.apache.hadoop.conf.Configuration;

            import
             org.apache.hadoop.fs.Path;

            import
             org.apache.hadoop.io.IntWritable;

            import
             org.apache.hadoop.io.LongWritable;

            import
             org.apache.hadoop.io.Text;

            import
             org.apache.hadoop.mapreduce.Job;

            import
             org.apache.hadoop.mapreduce.Mapper;

            import
             org.apache.hadoop.mapreduce.Reducer;

            import
             org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

            import
             org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

            import
             org.bigdata.util.HadoopCfg;

            import
             org.apache.hadoop.mapreduce.lib.input.FileSplit;


            /*
            
 * 2016-5-8
 * @author:lixin
 * 求矩阵乘积
 * 
            */
            public
            class
             Matrix {
    
    
            public
            static
            int tFlag = 0;
    privatestaticclass MatrixMapper extends Mapper<LongWritable, Text, IntWritable, Text>{

        privatestaticint columnN = 0;
        privatestaticint rowM = 0;
        
        @Override
        protectedvoid setup(Mapper<LongWritable, Text, IntWritable, Text>.Context context)
                throws IOException, InterruptedException {
            Configuration conf = HadoopCfg.getInstance();
            columnN = conf.getInt("columnN",0);
            rowM = conf.getInt("rowM",0);
        }
        
        
        @Override
        protectedvoid map(LongWritable key, Text value, Mapper<LongWritable, Text, IntWritable, Text>.Context context)
                throws IOException, InterruptedException {
            FileSplit fileSplit = (FileSplit) context.getInputSplit();
            String fileName = fileSplit.getPath().getName();
            String str = value.toString();
            String[] strs = str.split(",");
            int i = Integer.parseInt(strs[0]);
            String[] strs2 = strs[1].split("\t");
            int j = Integer.parseInt(strs2[0]);
            int val = Integer.parseInt(strs2[1]);
            if (fileName.startsWith("M")) {
                    context.write(new IntWritable(j), new Text("M," + i
                            + "," + val + ""));
            } else {// fileName == N
                    context.write(new IntWritable(i), new Text("N," + j
                            + "," + val + ""));
            }
        }
    }
    
    privatestaticclass MatrixReducer extends Reducer<IntWritable, Text, Text, IntWritable> {
        privatestaticint columnN = 0;
        privatestaticint rowM = 0;
        
        @Override
        protectedvoid setup(
                Reducer<IntWritable, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            Configuration conf = context.getConfiguration();
            columnN = conf.getInt("columnN",0);
            rowM = conf.getInt("rowM",0);
        }
        
        @Override
        protectedvoid reduce(IntWritable key, Iterable<Text> values, Reducer<IntWritable, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            int[] mArray = newint[rowM + 1];
            int[] nArray = newint[columnN + 1];
            for (Text value : values) {
                String str = value.toString();
                String[] strs = str.split(",");
                if (strs[0].equals("M")) {
                    mArray[Integer.parseInt(strs[1])] = Integer
                            .parseInt(strs[2]);
                } else { // N
                    nArray[Integer.parseInt(strs[1])] = Integer
                            .parseInt(strs[2]);
                }
            }
            for (int i = 1; i <= rowM; i++) {
                for(int j = 1;j <= columnN;j ++){
//                    System.out.println("mArray[i]:  "+mArray[i]+"nArray[j]:   "+nArray[j]);
                    context.write(new Text(i+","+j), new IntWritable(mArray[i]*nArray[j]));
                }
            }
        }
        
    }
    privatestaticclass MatrixMapper2 extends Mapper<LongWritable, Text, Text, IntWritable>{

        @Override
        protectedvoid map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            String str = value.toString();
            String keyOut[] = str.split("\t");
            context.write(new Text(keyOut[0]), new IntWritable(Integer.parseInt(keyOut[1])));
        }
    }
    
    privatestaticclass MatrixReducer2 extends Reducer<Text, IntWritable, Text, Text> {
        
        @Override
        protectedvoid reduce(Text key, Iterable<IntWritable> values, Reducer<Text, IntWritable, Text, Text>.Context context)
                throws IOException, InterruptedException {
            int sum = 0;
            for(IntWritable value : values){
                sum += value.get();
            }
            context.write(key, new Text(""+sum));
        }
        
    }
    
    publicstaticvoid runFirstReduce() throws Exception{
        Configuration config = HadoopCfg.getInstance();
        config.setInt("rowM",2);
        config.setInt("columnM",2);
        config.setInt("columnN",3);
        
        Job job = Job.getInstance(config,"矩阵运算第一次reduce");
        job.setJarByClass(Matrix.class);
        job.setMapperClass(MatrixMapper.class);
        job.setMapOutputKeyClass(IntWritable.class);
        job.setMapOutputValueClass(Text.class);
        
        job.setReducerClass(MatrixReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        
        FileInputFormat.addInputPath(job, new Path("/MatrixInput"));
        FileOutputFormat.setOutputPath(job,new Path("/output/reduce1"));
        job.waitForCompletion(true);
        
    }
    
    publicstaticvoid runSecondReduce() throws Exception{
        Configuration config = HadoopCfg.getInstance();
        
        Job job = Job.getInstance(config,"矩阵运算第二次reduce");
        job.setJarByClass(Matrix.class);
        job.setMapperClass(MatrixMapper2.class);
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        
        job.setReducerClass(MatrixReducer2.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(Text.class);
        
        FileInputFormat.addInputPath(job, new Path("/output/reduce1"));
        FileOutputFormat.setOutputPath(job,new Path("/output/reduce2"));
        job.waitForCompletion(true);
        
    }
        
    publicstaticvoid main(String[] args) throws Exception {
        runFirstReduce();
        runSecondReduce();
        
    }
}

普通方法：

            package
             org.bigdata508.util;


            import
             java.io.IOException;


            import
             org.apache.hadoop.conf.Configuration;

            import
             org.apache.hadoop.fs.Path;

            import
             org.apache.hadoop.io.IntWritable;

            import
             org.apache.hadoop.io.LongWritable;

            import
             org.apache.hadoop.io.Text;

            import
             org.apache.hadoop.mapreduce.Job;

            import
             org.apache.hadoop.mapreduce.Mapper;

            import
             org.apache.hadoop.mapreduce.Reducer;

            import
             org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

            import
             org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

            import
             org.bigdata.util.HadoopCfg;

            import
             org.apache.hadoop.mapreduce.lib.input.FileSplit;


            /*
            
 * 2016-5-8
 * @author:lixin
 * 求矩阵乘积
 * 
            */
            public
            class
             Matrix {
    
    
            public
            static
            int tFlag = 0;
    privatestaticclass MatrixMapper extends Mapper<LongWritable, Text, Text, Text>{

        privatestaticint columnN = 0;
        privatestaticint rowM = 0;
        
        @Override
        protectedvoid setup(Mapper<LongWritable, Text, Text, Text>.Context context)
                throws IOException, InterruptedException {
//            Configuration conf = HadoopCfg.getInstance();
            columnN = 3;//conf.getInt("columnN",0);
            rowM = 2;//conf.getInt("rowM",0);        }
        
        
        @Override
        protectedvoid map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, Text>.Context context)
                throws IOException, InterruptedException {
            FileSplit fileSplit = (FileSplit) context.getInputSplit();
            String fileName = fileSplit.getPath().getName();
            String str = value.toString();
            String[] strs = str.split(",");
            int i = Integer.parseInt(strs[0]);
            String[] strs2 = strs[1].split("\t");
            int j = Integer.parseInt(strs2[0]);
            int val = Integer.parseInt(strs2[1]);
            if (fileName.startsWith("M")) {
                for (int count = 1; count <= columnN; count++) {
                    context.write(new Text(i + "," + count), new Text("M," + j
                            + "," + val + ""));
                }
            } else {// fileName == Nfor (int count = 1; count <= rowM; count++) {
                    context.write(new Text(count + "," + j), new Text("N," + i
                            + "," + val + ""));
                }
            }
        }
    }
    
    privatestaticclass MatrixReducer extends
            Reducer<Text, Text, Text, IntWritable> {
        privatestaticint columnM = 0;
        
        @Override
        protectedvoid setup(
                Reducer<Text, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
//            Configuration config = context.getConfiguration();
            columnM = 2;//config.getInt("columnM", 0);        }
        
        @Override
        protectedvoid reduce(Text key, Iterable<Text> values,
                Reducer<Text, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            System.out.println(key);
            int finalVal = 0;
            int[] mArray = newint[columnM + 1];
            int[] nArray = newint[columnM + 1];
            for (Text value : values) {
                String str = value.toString();
                String[] strs = str.split(",");
                if (strs[0].equals("M")) {
                    mArray[Integer.parseInt(strs[1])] = Integer
                            .parseInt(strs[2]);
                } else { // N
                    nArray[Integer.parseInt(strs[1])] = Integer
                            .parseInt(strs[2]);
                }
            }
            for (int i = 1; i < columnM + 1; i++) {
                finalVal += (mArray[i] * nArray[i]);
            }
            context.write(key, new IntWritable(finalVal));
        }
        
        }
        
        publicstaticvoid main(String[] args) throws Exception {
        Configuration config = HadoopCfg.getInstance();
//        config.setInt("rowM",100);
//        config.setInt("columnM",90);
//        config.setInt("columnN",70);        
        Job job = Job.getInstance(config,"矩阵运算");
        job.setJarByClass(Matrix.class);
        job.setMapperClass(MatrixMapper.class);
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(Text.class);
        
        job.setReducerClass(MatrixReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        
        FileInputFormat.addInputPath(job, new Path("/MatrixInput"));
        FileOutputFormat.setOutputPath(job,new Path("/output/"));
        System.exit(job.waitForCompletion(true)? 0 : 1);
        
        }
}

            M-Matrix
1,1    1
1,2    2
2,1    1
2,2    3

原文：http://www.cnblogs.com/Decmber/p/5491920.html

内容总结

以上是互联网集市为您收集整理的hadoop-矩阵相乘法（MapReduce学习）全部内容，希望文章能够帮你解决hadoop-矩阵相乘法（MapReduce学习）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1306699.html

来源：【匿名】

【下一篇】php能用hadoop吗

更多 ►

【hadoop-矩阵相乘法（MapReduce学习）】教程文章相关的互联网学习教程文章

Hadoop on Mac with IntelliJ IDEA - 10 陆喜恒. Hadoop实战（第2版）6.4.1（Shuffle和排序）Map端内容整理【代码】【图】

下午对着源码看陆喜恒. Hadoop实战（第2版）6.4.1 （Shuffle和排序）Map端，发现与Hadoop 1.2.1的源码有些出入。下面作个简单的记录，方便起见，引用自书本的语句都用斜体表示。依书本，从MapTask.java开始。这个类有多个内部类：从书的描述可知，collect()并不在MapTask类，而在MapOutputBuffer类，其函数功能是1、定义输出内存缓冲区为环形结构2、定义输出内存缓冲区内容到磁盘的操作在collect函数中将缓冲区的内容写出时会调用...

hadoop第五课：java开发Map/Reduce【代码】

配置系统环境变量HADOOP_HOME，指向hadoop安装目录（如果你不想招惹不必要的麻烦，不要在目录中包含空格或者中文字符）把HADOOP_HOME/bin加到PATH环境变量（非必要，只是为了方便）如果是在windows下开发，需要添加windows的库文件把盘中共享的bin目录覆盖HADOOP_HOME/bin如果还是不行，把其中的hadoop.dll复制到c:\windows\system32目录下，可能需要重启机器建立新项目，引入hadoop需要的jar文件代码WordMapper：import java.io.I...

设置Hadoop的 dataNode的单个Map的内存配置

1、进入hadoop的配置目录，找到环境变量的 $HADOOP_HOMEcd $HADOOP_HOME2、修改dataNode 节点的单个map的能使用的内存配置找到配置的文件：/opt/aisc/app/hadoop-2.3.0-cdh5.1.2/etc/hadoop/mapred-site.xml 增加如下的配置：设置java的内存大小参数是；512M 大小根据的实际情况调整 <property><name>mapred.child.java.opts</name><value>-Xmx512m</value></property>原文：http://www.cnblogs.com/lilin0719/p/6798720.html

Hadoop日记Day17---计数器、map规约、分区学习【代码】【图】

一、Hadoop计数器1.1 什么是Hadoop计数器　　Haoop是处理大数据的，不适合处理小数据，有些大数据问题是小数据程序是处理不了的，他是一个高延迟的任务，有时处理一个大数据需要花费好几个小时这都是正常的。下面我们说一下Hadoop计数器，Hadoop计数器就相当于我们的日志，而日志可以让我们查看程序运行时的很多状态，而计数器也有这方面的作用。那么就研究一下Hadoop自身的计数器。计数器的程序如代码1.1所示，下面代码还是以内容...

Hadoop on Mac with IntelliJ IDEA - 9 解决Type mismatch in value from map问题【代码】

修改陆喜恒. Hadoop实战（第2版）5.3排序的代码时遇到IO异常。环境：Mac OS X 10.9.5, IntelliJ IDEA 13.1.5, Hadoop 1.2.1异常具体信息如下 1 14/10/06 03:08:51 INFO mapred.JobClient: Task Id : attempt_201410021756_0043_m_000000_0, Status : FAILED2 java.io.IOException: Type mismatch in value from map: expected org.apache.hadoop.io.IntWritable, recieved org.apache.hadoop.io.Text3 at org.apache.hadoop.ma...

如何在hadoop中控制map的个数

hadooop提供了一个设置map个数的参数mapred.map.tasks，我们可以通过这个参数来控制map的个数。但是通过这种方式设置map 的个数，并不是每次都有效的。原因是mapred.map.tasks只是一个hadoop的参考数值，最终map的个数，还取决于其他的因素。为了方便介绍，先来看几个名词：block_size : hdfs的文件块大小，默认为64M，可以通过参数dfs.block.size设置total_size : 输入文件整体的大小input_file_num : 输入文件的个数（1）默...

hadoop 多目录输入，map到reduce如何排序

使用MultipleInputs.addInputPath 对多个路径输入现在假设有三个目录，并使用了三个mapper去处理，经过map处理后，输出的结果会根据key 进行join，如果使用TextPair，会根据第一个字段jion，第二个字段排序然后在作为reduce的输入，进行计算原文：http://blog.csdn.net/smile0198/article/details/34534241

hadoop map-reduce中的文件并发操作

这样的操作在map端或者reduce端均可。下面以一个实际业务场景中的例子来简要说明。问题简要描述：假如reduce输入的key是Text(String),value是BytesWritable(byte[]),不同key的种类为100万个，value的大小平均为30k左右，每个key大概对应 100个value,要求对每一个key建立两个文件，一个用来不断添加value中的二进制数据，一个用来记录各个value在文件中的位置索引。(大量的小文件会影响HDFS的性能，所以最好对这些小文件进行拼接）当...

Hadoop:一个目录下的数据只由一个map处理

有这么个需求：一个目录下的数据只能由一个map来处理。如果多个map处理了同一个目录下的数据会导致数据错乱。刚开始google了下，以为网上都有现成的InputFormat，找到的答案类似我之前写的 mapreduce job让一个文件只由一个map来处理。或者是把目录写在文有这么个需求：一个目录下的数据只能由一个map来处理。如果多个map处理了同一个目录下的数据会导致数据错乱。刚开始google了下，以为网上都有现成的InputFormat，找到的答案...

Hadoop的Map-sidejoin和Reduce-sidejoin【图】

Hadoop中连接（join）操作很常见，Hadoop“连接”的概念本身，和SQL的“连接”是一致的。SQL的连接，在维基百科中已经说得非常清楚。比如dataset A是关于用户个人信息的，key是用户id，value是用户姓名等等个人信息；dataset B是关于用户交易记录的，key是用 Hadoop中连接（join）操作很常见，Hadoop“连接”的概念本身，和SQL的“连接”是一致的。SQL的连接，在维基百科中已经说得非常清楚。比如dataset A是关于用户个人信息的，k...

如何在Hadoop中控制map的个数

转载自：如何在hadoop中控制map的个数hadoop提供了一个设置map个数的参数mapred.map.tasks，我们可以通过这个参数来控制map的个数。但是通过这种方式设置map的个数，并不是每次都有效的。原因是mapred.map.tasks只是一个hadoop的参考数值，最终map的个数，还转载自：如何在hadoop中控制map的个数 hadoop提供了一个设置map个数的参数mapred.map.tasks，我们可以通过这个参数来控制map的个数。但是通过这种方式设置map的个数，并不是...

eclipse中开发Hadoop2.x的Map/Reduce项目【图】

本文演示如何在Eclipse中开发一个Map/Reduce项目： 1、环境说明 Hadoop2.2.0 Eclipse?Juno SR2 Hadoop2.x-eclipse-plugin 插件的编译安装配置的过程参考：http://www.micmiu.com/bigdata/hadoop/hadoop2-x-eclipse-plugin-build-install/ 2、新建MR工程依次本文演示如何在Eclipse中开发一个Map/Reduce项目： 1、环境说明 Hadoop2.2.0Eclipse?Juno SR2Hadoop2.x-eclipse-plugin 插件的编译安装配置的过程参考：http://www.micmiu.c...

hadoop学习（七）WordCount+Block+Split+Shuffle+Map+Reduce技术【图】

纯干活：通过WourdCount程序示例：详细讲解MapReduce之BlockSplitShuffleMapReduce的区别及数据处理流程。 Shuffle过程是MapReduce的核心，集中了MR过程最关键的部分。要想了解MR，Shuffle是必须要理解的。了解Shuffle的过程，更有利于我们在对MapReduce job纯干活：通过WourdCount程序示例：详细讲解MapReduce之Block+Split+Shuffle+Map+Reduce的区别及数据处理流程。Shuffle过程是MapReduce的核心，集中了MR过程最关键的部分。要...

python的map和reduce和Hadoop的MapReduce有什么关系？

如题回复内容： hadoop map阶段所做的事类比于 python maphadoop reduce阶段所做的事类比于 python groupby但只是类比，hadoop map阶段和reduce阶段有更具体细节的不同步骤，两者牛头无法对上马嘴。MapReduce是一种Google第一次提出的，在并行集群里对大数据进行计算的的一种编程模型。它包括map与reduce。map与reduce来源于函数式编程的两个方法。Hadoop的MapReduce是对Google MapReduce的一个开源实现。它提供Map与Reduce两个接...

python-Win32平台的Hadoop / Map-reduce框架的替代方案

我发现Windows上的Hadoop有点令人沮丧：我想知道对于Win32用户,是否有Hadoop的替代品.我最看重的功能是： >易于初始设置和在较小的网络上进行部署(如果我们为该项目分配了20台以上的PC,我会感到惊讶)>易于管理-理想的框架应该具有基于Web / GUI的管理系统,这样我就不必自己写书了.>流行的东西稳定.奖金取决于我们能否及时交付该项目. 背景：我工作的公司希望建立一个新的网格系统来运行一些财务计算. 我一直在评估的第一个框架是H...

HADOOP - 最热教程

Windows下在eclipse中使用和操作hadoop...windows下大数据开发环境搭建（1）——...Hadoop与Facebook Hadoop基础知识 windows部署hadoop-2.7.0 使用 Oracle Load For Hadoop（OLH）实...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...WSL2+Ubuntu配置Java Maven Hadoop Spa...Hadoop之MapReduce单元测试

首页 / HADOOP / hadoop-矩阵相乘法（MapReduce学习）

hadoop-矩阵相乘法（MapReduce学习）

内容导读

内容图文

内容总结

内容备注

内容手机端

【hadoop-矩阵相乘法（MapReduce学习）】教程文章相关的互联网学习教程文章

Hadoop on Mac with IntelliJ IDEA - 10 陆喜恒. Hadoop实战（第2版）6.4.1（Shuffle和排序）Map端内容整理【代码】【图】

hadoop第五课：java开发Map/Reduce【代码】

设置Hadoop的 dataNode的单个Map的内存配置

Hadoop日记Day17---计数器、map规约、分区学习【代码】【图】

Hadoop on Mac with IntelliJ IDEA - 9 解决Type mismatch in value from map问题【代码】

如何在hadoop中控制map的个数

hadoop 多目录输入，map到reduce如何排序

hadoop map-reduce中的文件并发操作

Hadoop:一个目录下的数据只由一个map处理

Hadoop的Map-sidejoin和Reduce-sidejoin【图】

如何在Hadoop中控制map的个数

eclipse中开发Hadoop2.x的Map/Reduce项目【图】

hadoop学习（七）WordCount+Block+Split+Shuffle+Map+Reduce技术【图】

python的map和reduce和Hadoop的MapReduce有什么关系？

python-Win32平台的Hadoop / Map-reduce框架的替代方案

HADOOP - 相关标签

MAP - 相关标签

HADOOP - 最新教程

HADOOP - 最热教程