首页 / LINUX / Linux shell 计算两个文件的并集、交集、差集

Linux shell 计算两个文件的并集、交集、差集

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Linux shell 计算两个文件的并集、交集、差集，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3627字，纯文字阅读大概需要6分钟。

内容图文

假设我们现在有两个文件 a.txt 、b.txt

a.txt 中的内容如下：

1 2 3 4 5 6 a c 1 3 d 4

b.txt 中的内容如下：

1 2 3 4 5 6 a b e 2 1 5

# Example 01

计算并集：

1 2 3 4 5 6 7 8 9 10 11 12 [root@VM_81_181_centos ~]# sort -u a.txt b.txt 1 2 3 4 5 a b c d e [root@VM_81_181_centos ~]#

# Exmaple 02

计算交集：

1 2 3 4 [root@VM_81_181_centos ~]# grep -F -f a.txt b.txt | sort | uniq 1 a [root@VM_81_181_centos ~]#

# Example 03

计算差集(a - b)：

1 2 3 4 5 6 [root@VM_81_181_centos ~]# grep -F -v -f b.txt a.txt | sort | uniq 3 4 c d [root@VM_81_181_centos ~]#

# Example 04

计算差集(b - a):

1 2 3 4 5 6 [root@VM_81_181_centos ~]# grep -F -v -f a.txt b.txt | sort | uniq 2 5 b e [root@VM_81_181_centos ~]#

-----------------------------------------------------------手动分割线---------------------------------------------------------------------------

2018/09/30 更新

上面介绍了关于如何使用 grep 命令实现文件的交、差集，但是在实际操作中得到的结果却有点问题存在

上面的命令我是用于求 a 、b 两个文件的交集，但是当把两个文件的位置顺序改变了一下，结果竟然是不

一样，这是不科学的。

后来仔细想了想，grep 命令是搜索查找的命令，举个例子：

c.txt 文件里面的内容如下：

1 2 3 4 1122 1133 1144 1155

d.txt 文件里面的内容如下:

1	`11223344`

执行 grep 命令:

1 2 3 4 [root@VM_81_181_centos ~]# grep -F -f c.txt d.txt | sort | uniq 11223344 [root@VM_81_181_centos ~]# grep -F -f d.txt c.txt | sort | uniq [root@VM_81_181_centos ~]#

根据结果，对第一条命令的解读是：

命令执行后，在 d.txt 文件里面搜索和 c.txt 文件相匹配的字符，因为 c.txt 文件里面的字符 1122 和 d.txt 文件里面的

字符 11223344 前面的 1122 相匹配，则就把 11223344 字符作为两个文件相同的部分记录下来

第二条命令：

命令执行后，在 c.txt 文件里面搜索和 d.txt 文件相匹配的字符，d.txt 文件里面的 11223344 在 c.txt 文件里面找不到

与其类似或相同的字符，所以，结果为空。

现在，在 c.txt 文件里面新增字符 112233445566，结果及操作如下：

c.txt 文件内容：

1 2 3 4 5 1122 1133 1144 1155 1122334455

执行 grep 命令：

1 2 3 [root@VM_81_181_centos ~]# grep -F -f d.txt c.txt | sort | uniq 1122334455 [root@VM_81_181_centos ~]#

结论：

1	`grep -F -f fileA fileB \| sort \| uniq`

当 fileA 文件在前，则表示在 fileB 文件里面搜索和 fileA 文件里面相同或者类似的字符，并将 fileB 文件里面那个字符记录下来

同理，fileB 在前，fileA 在后的情况。

但是，在这里这并不是我们想要的结果，我们想要的结果就是我们以前学数学时候，求两个集合的交集一样，结果输

出的是两个集合共有的部分，尝试了几个方法，最后还是选择使用 cat 命令。

命令格式如下:

1 2	`cat fileA fileB \| sort \| uniq -d? # 求交集` `cat fileA fileB \| sort \| uniq -u? # 求差集`

这个命令比较好理解，cat 命令先把两个文件合并成一个文件，然后在对合并后的文件进行排序、去重，-d 命令输出文

件中相同的字符，-u 命令输出文件中不同的字符，并且在计算交集的时候 fileA、fileB 文件顺序哪个在前在后的结果都是一样的。

案例如下：

1 2 3 4 5 6 7 8 9 10 [root@VM_81_181_centos ~]# cat c.txt 1122 1133 1144 1155 1122334455 [root@VM_81_181_centos ~]# cat d.txt 11223344 1122 [root@VM_81_181_centos ~]#

c、d 文件内容如上

执行 cat 命令求交集：

1 2 3 4 5 [root@VM_81_181_centos ~]# cat c.txt d.txt | sort | uniq -d 1122 [root@VM_81_181_centos ~]# cat d.txt c.txt | sort | uniq -d 1122 [root@VM_81_181_centos ~]#

执行 cat 命令求差集：

1 2 3 4 5 6 7 8 9 10 11 12 13 [root@VM_81_181_centos ~]# cat c.txt d.txt | sort | uniq -u 11223344 1122334455 1133 1144 1155 [root@VM_81_181_centos ~]# cat d.txt c.txt | sort | uniq -u 11223344 1122334455 1133 1144 1155 [root@VM_81_181_centos ~]#

但是 cat 命令也有一个短板，当文件比较大的时候，就会出错，但是在这里我们可以去借助

内容总结

以上是互联网集市为您收集整理的Linux shell 计算两个文件的并集、交集、差集全部内容，希望文章能够帮你解决Linux shell 计算两个文件的并集、交集、差集所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/939694.html

来源：【匿名】

【上一篇】Linux学习笔记三【下一篇】Linux下安装GD

更多 ►

【Linux shell 计算两个文件的并集、交集、差集】教程文章相关的互联网学习教程文章

老李分享：《Linux Shell脚本攻略》要点（二）

poptest是国内唯一一家培养测试开发工程师的培训机构，以学员能胜任自动化测试，性能测试，测试工具开发等工作为目标。如果对课程感兴趣，请大家咨询qq：908821478。Linuxshell是测试开发工程师的基本功之一，所以在poptest测试开发课堂上加入了大量的linuxshell的课程，为了学员开发跨平台的测试平台打基础。 1、cat cat -s //多个空白行压缩成一个 cat *.txt | tr -s ‘\n‘ //移除空白行 cat -n //加行号2、find...

Linux C/C++调用shell命令后获取shell返回值【代码】

Linux C/C++调用shell命令后获取shell返回值项目中C/C++调用shell命令后，某系处理返回值的过程是以“临时文件”的方式进行；即shell命令执行后将返回值存放在临时文件（如temp.txt），C/C++程序再访问文件，获取shell的返回值。最经典的就是调用WiFi（iwlist wlan0 scan ）扫描指令查询WiFi节点，然后解析获取WiFi数量、名称、信号强度、加密方式等信息。通过“临时文件”的方式交互数据，是比较简单、易用和易理解的方式，在多进...

Linux的shell脚本的语句，函数，检测服务，启动脚本的练习【图】

一.if语句650) this.width=650;" src="/upload/getfiles/default/2022/11/7/20221107042726687.jpg" title="Screenshot from 2017-11-11 20-01-52.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/7/20221107042726972.jpg" title="Screenshot from 2017-11-11 20-09-41.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/7/20221107042727203.jpg" title="Screenshot from 2017-11-11...

Linux Shell 高级编程技巧1---深入讨论（awk、<<）【代码】

1.深入讨论（awk、<<） 1.1.深入讨论awk 记录和域，模式和动作，正则表达式和元字符基础教程中已经介绍条件和逻辑操作符 < 小于 >= 大于等于 <= 小于等于 == 等于 != 不等于 ~ 匹配正则表达式 !~ 不匹配正则表达式 && and || or ! not ...

【shell】Linux shell for 循环详解【代码】

CASE20210510 - Linux shell脚本基础详解【代码】

1.变量shell中特殊变量：序号变量含义1$0当前脚本的文件名2$n传递给脚本或函数的参数。n是一个数字，表示第几个参数3$#传递给脚本或函数的参数个数4$*传递给脚本或函数的所有参数5$@传递给脚本或函数的所有参数，被双引号包含时，与$*稍有不同6$?上个命令的退出状态，或函数的返回值7$-显示shell使用的当前选项8$$当前shell进程ID，对于shell脚本，就是这些脚本所在的进程ID9$!后台运行的最后一个进程的ID号Linux环境变量：查看变...

linux shell cat 命令

cat：查看文件的内容、连接文件、创建一个或多个文件和重定向输出到终端或文件用法：cat [选项] [文件]1. $ cat hello.txt显示hello.txt文本文件中的内容 2. $ cat -n file-n选项，可以显示文件的内容和行号 3. $ cat -b file-b选项，与-n类似，但只标识非空白行的行号（空白行仍显示） 4. $ cat -e file-e选项，将在每一行的末尾显示“$”字符，在需要将多行内容转换成一行时非常有用。 5. $ cat只输入cat命令的话，它只是接收标...

linux shell--算术运算【代码】

求和：方法一、使用命令替换法：#!/bin/bashread -p ‘input number a...‘ numA read -p ‘input number b...‘ numB #这里有两个要注意的点，一：等号两边不能有空格、二：小括号之间不能有空格 sum=$(($numA+$numB))echo"${numA} + ${numB} = ${sum}" 方法二、直接运算#!/bin/bashread -p ‘input number a...‘ numA read -p ‘input number b...‘ numBsum=$[$numA+$numB] echo"${numA} + ${numB} = ${sum}" 原文：http://www...

linux shell学习之shell流程控制

在linux shell编程中，流程控制结构与语句，也算是shell脚本中的重点了，不了解的朋友，跟随脚本小编一起来学习下吧。linux控制流结构学习。一，shell控制流结构1.控制结构 6.while循环 2.if then else语句 7.until循环 3.case 语句 8.break控制 5.for循环 9.continue控制1，if then else if 条件1 如果条件1为真 then 那么命令1 执行命令1 elif 条件2 如果条件1不成立而条件2成立 then 那么命令2 执行命令2 else 如...

win10上使用Xshell通过ssh连接Linux【代码】【图】

Windows 10上现在能安装Linux子系统了，正好最近.Net Core也逐渐发展起来了，我也就在自己电脑上搞了一下在Windows 10上安装Ubuntu的过程就不用说了，都是流程性的东西然后配置完基础性的东西以后，习惯性的打算用Xshell通过SSH登录过去然后emmmm连接失败，好吧然后么，百度了下解决办法，大部分都是在说修改ssh的port，说是Win10会占用22端口，所以连接失败，既然如此，我就只能修改ssh_config这个配置文件了然后改了以后并且重置...

linux crontab定时任务运行shell脚本（shell执行sql文件）

今天做个linux定时任务（每晚12点把表汇总）。顺便写个博客记录一下~~为什么用linux定时任务，而不是在项目加定时任务呢？原因就是防止因为各种原因项目崩溃。。所以就用了更加稳定的linux定时任务（我是这么想的( ^_^ )）。起初我感觉很简单，以为顶多半小时就搞定了，，，结果从10点弄到12点半才搞定（主要是我英语太渣和数据库报错导致）。。。︿(￣︶￣)︿废话到此结束---------------crontab 格式 *　　*　　*　　*　　* ...

用Xshell连接Linux系统时输入反斜杠成W

用Xshell连接Linux系统时输入反斜杠成W只是xshell 设置问题在FILE（文件）——>Properties（属性）里面》》外观如下标注位置配置改为： Courier New 即ok原文：http://362155856.blog.51cto.com/6312063/1660901

linux shell实现随机数几种方法分享(date,random,uuid)【代码】

在日常生活中，随机数实际上经常遇到，想丢骰子，抓阄，还有抽签。呵呵，非常简单就可以实现。那么在做程序设计，真的要通过自己程序设计出随机数那还真的不简单了。现在很多都是操作系统内核会提供相应的api，这些原始参数是获取一些计算机运行原始信息，如内存，电压，物理信号等等，它的值在一个时间段可以保证是唯一的了。好了，废话我就不说了。呵呵。shell脚本程序我们有那些获得随机数方法呢？一、通过时间获得随机数（date...

Xshell设置密钥登录确保Linux【代码】

用Xshell设置密匙登陆服务器，第一步、使用Xshell生成密钥我们打开熟悉的XSHELL软件，然后在工具-新建用户密钥生成向导。到了生成密钥参数界面，我们这里需要选择RSA密钥类型，以及密钥长度可以选择1024或者我这里选择2048.然后点击下一步按钮。继续下一步，我们需要给我们设置的私钥加密。点击下一步，生成密钥。公钥格式选择SSH2-OPENSSH，我们可以复制公钥以及保存为文件后完成。第二步、上传公钥至服务器中A - 将我们生成的lao...

Linux Shell经典面试题【代码】

查空行 awk‘/^$/{print NR}‘ demo1.txt求某一列的和 awk‘{sum+=$2} END {print "求和："sum}‘ demo2.txt数字排序 sort -n -t ‘‘ -k 2 demo3.txt sort -t ‘‘ -k 2nr demo3.txt搜索指定目录下文件内容 grep -r ‘666‘ /root/ | cut -d ‘:‘ -f 1 | sort -u筛选出单词长度大于3的单词 echo"I may not be able to change the past, but I can learn from it." | awk -F "[ ,.]"‘{for(i=1;i<=NF;i++){if(length($i)>3){print...

LINUX - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...VMware中Linux虚拟机挂载主机共享文件夹...Linux双网卡配置虚拟机下Linux安装好Nginx后，宿主机无...linux下安装postgresql并配置远程图形桌...Linux命令--exportfs命令详解 linux 终端printf打印显示乱码问题修正 Linux下Shell的for循环语句N种写法 Linux下创建nginx脚本-start、stop、re...SUSELinux安装MySQL

首页 / LINUX / Linux shell 计算两个文件的并集、交集、差集

Linux shell 计算两个文件的并集、交集、差集

内容导读

内容图文

假设我们现在有两个文件 a.txt 、b.txt

内容总结

内容备注

内容手机端

【Linux shell 计算两个文件的并集、交集、差集】教程文章相关的互联网学习教程文章

老李分享：《Linux Shell脚本攻略》要点（二）

Linux C/C++调用shell命令后获取shell返回值【代码】

Linux的shell脚本的语句，函数，检测服务，启动脚本的练习【图】

Linux Shell 高级编程技巧1---深入讨论（awk、<<）【代码】

【shell】Linux shell for 循环详解【代码】

CASE20210510 - Linux shell脚本基础详解【代码】

linux shell cat 命令

linux shell--算术运算【代码】

linux shell学习之shell流程控制

win10上使用Xshell通过ssh连接Linux【代码】【图】

linux crontab定时任务运行shell脚本（shell执行sql文件）

用Xshell连接Linux系统时输入反斜杠成W

linux shell实现随机数几种方法分享(date,random,uuid)【代码】

Xshell设置密钥登录确保Linux【代码】

Linux Shell经典面试题【代码】

LINUX - 相关标签

文件 - 相关标签

LINUX - 最新教程

LINUX - 最热教程