首页 / LINUX / linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？

linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1531字，纯文字阅读大概需要3分钟。

内容图文

我有两个包含大量文本的大文件,我要做的是将文件A中的所有行保留在一个字段中,该字段与文件B中的字段匹配.

文件A是这样的：

Name (tab)  #  (tab)  #  (tab)  KEYFIELD  (tab)  Other fields

文件B我设法使用cut和sed等基本上将它归结为一个列表的字段.

因此,如果该行的字段与文件B中的一行匹配,则目标是将文件A中的所有行保留在第4个字段(它表示为KEYFIELD).(不必是完全匹配,因此如果文件B具有Blah和文件A说Blah_blah,没关系

我试着这样做：

grep -f fileBcutdown fileA > outputfile

编辑：好的,我放弃了.我只是强迫它杀了它.

有一个更好的方法吗？对于任何关心的人来说,文件A是13.7MB,减少后的文件B是32.6MB.

编辑：这是文件A中的示例行：

chr21 33025905 33031813 ENST00000449339.1 0 - 33031813 33031813 0 3 1835,294,104, 0,4341,5804,

文件B中的示例行减少：

ENST00000111111

解决方法:

这是使用GNU awk的一种方式.运行如下：

awk -f script.awk fileB.txt fileA.txt

script.awk的内容：

FNR==NR {
    array[$0]++
    next
}

{
    line = $4
    sub(/\.[0-9]+$/, "", line)
    if (line in array) {
        print
    }
}

或者,这是单行：

awk 'FNR==NR { array[$0]++; next } { line = $4; sub(/\.[0-9]+$/, "", line); if (line in array) print }' fileB.txt fileA.txt

GNU awk还可以执行使用cut和sed描述的fileB.txt的预处理.如果您希望我将其构建到上面的脚本中,您需要提供此行的示例.

使用文件HumanGenCodeV12和GenBasicV12进行更新：

运行如下：

awk -f script.awk HumanGenCodeV12 GenBasicV12 > output.txt

script.awk的内容：

FNR==NR {
    gsub(/[^[:alnum:]]/,"",$12)
    array[$12]++
    next
}

{
    line = $4
    sub(/\.[0-9]+$/, "", line)
    if (line in array) {
        print
    }
}

这成功地在GenBasicV12中打印了可以在HumanGenCodeV12中找到的行.输出文件(output.txt)包含65340行.该脚本只需不到10秒即可完成.

内容总结

以上是互联网集市为您收集整理的linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？全部内容，希望文章能够帮你解决linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/953215.html

来源：【匿名】

【上一篇】c – 在Linux下共享内存映射【下一篇】Linux下安装GD

更多 ►

【linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？】教程文章相关的互联网学习教程文章

Linux根文件系统和目录结构及bash特性1

Linux文件系统：内核并不真正负责具体的工作，这些工作是应用程序来负责的 Linux glibc 程序的编译方式：动态链接式编译：静态链接式编译：进程的类型：终端：硬件设备国，关联一个用户接口与终端相关：通过终端启动与终端无关：操作引导启动过程当中自动启动操作系统的组成：静态：kernel,application 文件系统：以层级结构划分，倒置的树状结构 ...

《生活在Linux中》之：prefer function to alias in Bash

在Bash环境中，定义了alias替换有时会产生不是想要的替换：e.g:;而定义function则可以避免这种缺陷。原文：http://blog.csdn.net/zhengkarl/article/details/24891699

Linux基础入门及系统管理01-Linux运维核心技能-bash基础特性详解09

一、bash及其特性 1、shell:外壳，用户直接连接计算机 a)GUI:Gnome、KDE、Xfce； b)CLI：sh、csh、ksh、bash、tcsh、zsh； 2、如果当前系统登录2个用户，2个用户的shell相同吗？ root,student:一个程序，2个进程；进程：在每个进程看来，当前主机上只存在内核和当前进程；进程是程序的副本，进程是程序执行实例； 3、用户工作环境 a)#：管理员，$：普通用户；每个用户的工作...

Shell程序及Linux中默认的Shell程序Bash的特性【图】

SHELL: 一方面指用户与操作系统之间完成交互式操作的接口程序的统称，可以为用户提供简化的操作；另一方面指shell也是一种程序语言；在上世纪70年代中期，著名的实验室中的实验人员Bourne发明了bourne shell程序，简称sh；之后美国计算机科学家 Bill joy根据bourne shell用C语言重新编译C bourne shell，简称csh，后来的衍生版名为tcsh；之后David korn集合csh和sh的优点发明korn shell，简称ksh；开源组织GNU在比较...

linux之bash的基础特性(一)-->命令历史(history命令),命令补全,路径补全【图】

关于命令历史-->history1.与之相关的环境变量:HISTSIZE,HISTFILE-->~/.bash_history,HISTFILESIZE,HISTCONTROL,HISTTIMEFORMAT　　HISTSIZE-->记录当前shell进程下命令历史的条数默认大小为1000　　HISTFILE-->可以用来设置保存历史命令文件的位置默认为~/.bash_history　　HISTFILESIZE-->可以设置历史文件能够保存历史命令的条数默认1000　　HISTCONTROL-->控制命令历史的记录方式共有3种方式分别为　　　　　　　ignoredups(忽略...

Linux 基础知识：Bash的内置变量

Bash默认建立了许多内置变量，以下介绍些这类变量。1. BASH用途：显示bash的完整路径名。通常是：/bin/bash或/usr/local/bin/bash。用例：echo $BASH2. BASH_VERSION用途：bash的版本。用例：echo $BASH4执行结果：4.1.2(1)-release3. FUNCNAME用途：在函数式执行期，此变量内容即为函数式的名称。用例：function show_name() { echo $FUNCNAME echo “今个儿是$1，你$2大大，来自$3”}4执行结果：显示函数式名称show_...

linux学习18 shell脚本基础-bash变量和逻辑运行【代码】

一、回顾　　1、用户管理，权限管理，install，mktemp　　2、用户管理：　　3、权限管理：　　　　mode，ownership　　　　mode：　　　　　　user　　　　　　group　　　　　　other　　　　　　r　　　　　　w　　　　　　x　　4、命令：install，mktemp二、bash特性及bash脚本编程初步　　1、终端：附着在终端的接口程序　　　　GUI：KDE，GNome，Xfce　　　　CLI：/etc/shells　　2、bash的特性：　　　　a、命令行展开：~，{...

Linux下提示 bash: xxx command not found

今天在虚拟机上安装了CentOS5.5，发现运行一些很正常的诸如：init，shutdown，fdisk 等命令时，悍然提示：bash: xxx command not found。那么，首先就要考虑root 的$PATH里是否已经包含了这些环境变量。主要是这四个：/bin , /usr/bin, /sbin, /usr/sbin。四个主要存放的东东：./bin:bin为binary的简写主要放置一些系统的必备执行档例如:cat、cp、chmod df、dmesg、gzip、kill、ls、mkdir、more、mount、rm、su、tar等。/sbin:主要...

linux之bash shell

GNU bash======================================================== 通常计算机硬件是由运算器、控制器、存储器、输入/输出设备等等这些物理设备共同组成的，而能够让机箱内各种硬件设备各司其职的东西就叫做系统内核。Linux系统的内核负责驱动硬件、管理活动和分配/管理硬件资源等等任务，如此说来系统内核对计算机正常稳定的运行来讲可真的是太重要了，因此一般不建议直接去编辑内核中的参数，而是让用户通过基于“系统调用接...

【Linux学习一】命令行CLI、BASH的基本操作【图】

●操作系统的基本结构操作系统的基本结构通过Kernel（内核）和Shell（壳）构成。常见的Shell分为GUI和CLIGUI 图形方面的shell ------〉windows 、mac osCLI 命令行方面的shell -----〉比图形强大以CentOS为例　　● GUI:GNOME　　● CLI:BASH ●提示符　　● # root用户（最高权限）　　● $ 普通用户 ●命令一般由（选项、命令、参数）组成。　　● uname 显示系统的基本信息　　　　● -r 内核版本号　...

Linux Bash Shell编程快速入门

BASH 的基本语法最简单的例子 —— Hello World!关于输入、输出和错误输出BASH 中对变量的规定（与 C 语言的异同）BASH 中的基本流程控制语法函数的使用2.1 最简单的例子 —— Hello World!几乎所有的讲解编程的书给读者的第一个例子都是 Hello World 程序，那么我们今天也就从这个例子出发，来逐步了解 BASH。用 vi 编辑器编辑一个 hello 文件如下：#!/bin/bash# This is a very simple exampleecho Hello World这样最简单的一...

Linux系统centOS 7执行netstat命令，提示bash:netstat:command not found......【图】

问题是这样的接着百度求助：网友说是缺少组件没安装好导致的，解决方法如下：yum install net-tools，执行此命令，集成在net-tools工具包中，这是将工具包软件都安装就可以解决最后Complete!代表完成后面可以运行查看端口命令原文：https://www.cnblogs.com/will-wu/p/12534413.html

Linux中环境变量/etc/profile ~/.bashrc 和 ~/.bash_profile 和 /etc/bashrc 的区别

650) this.width=650;" src="http://blog.chinaunix.net/attachment/201406/16/14735472_14028883441bDJ.png" width="360" height="450" border="0" hspace="0" vspace="0" title="" /> 这个一定要理解登录式shell和非登录式shell的区别，前者是完全切换用户，后者是不完全，就算切换过来了，你pwd时家目录还是之前的家目录，所以登录式顺序为：/etc/bashrc---/etc/profile.d/*.sh----~/.bash_profile---~/.bashrc_profile...

linux突然所有命令都失效了，显示bash: xxxxx: command not found...

出现这个问题是因为系统的环境变量没有正确配置造成的，造成这个原因有很多，比如系统升级，比如不正当操作。解决的方式有两种。其一：直接在linux命令行界面输入如下，然后回车（导入环境变量，以及shell常见的命令的存放地址）： export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin 其二：如果系统所有命令都不能使用时，还可以使用绝对命令vi打开profile /bin/vi /etc...

Linux学习 -- Shell基础 -- Bash变量【图】

变量　　默认是字符串型，数值型需要显示指定　　等号两侧都不能有空格　　单引号：原始字符串双引号：保留转义　　命令结果作为值：反引号或 $()　　环境变量一般用大写自定义变量　　变量定义 name="xx oo"　　变量叠加 aa=123 aa="$aa"456 aa=${aa}789　　变量调用 echo $aa　　变量查看 set　　变量删除 unset aa 环境变量　　用户自定义变量 -- 只在当前Shell中生效　　环境变量 -- 当前Shell和所有子...

字段 - 相关标签

字段类型

LINUX - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...VMware中Linux虚拟机挂载主机共享文件夹...Linux双网卡配置虚拟机下Linux安装好Nginx后，宿主机无...linux下安装postgresql并配置远程图形桌...Linux命令--exportfs命令详解 linux 终端printf打印显示乱码问题修正 Linux下Shell的for循环语句N种写法 Linux下创建nginx脚本-start、stop、re...SUSELinux安装MySQL

首页 / LINUX / linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？

linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？

内容导读

内容图文

内容总结

内容备注

内容手机端

【linux – Bash：如何保持文件中的行具有与另一个文件中的行匹配的字段？】教程文章相关的互联网学习教程文章

Linux根文件系统和目录结构及bash特性1

《生活在Linux中》之：prefer function to alias in Bash

Linux基础入门及系统管理01-Linux运维核心技能-bash基础特性详解09

Shell程序及Linux中默认的Shell程序Bash的特性【图】

linux之bash的基础特性(一)-->命令历史(history命令),命令补全,路径补全【图】

Linux 基础知识：Bash的内置变量

linux学习18 shell脚本基础-bash变量和逻辑运行【代码】

Linux下提示 bash: xxx command not found

linux之bash shell

【Linux学习一】命令行CLI、BASH的基本操作【图】

Linux Bash Shell编程快速入门

Linux系统centOS 7执行netstat命令，提示bash:netstat:command not found......【图】

Linux中环境变量/etc/profile ~/.bashrc 和 ~/.bash_profile 和 /etc/bashrc 的区别

linux突然所有命令都失效了，显示bash: xxxxx: command not found...

Linux学习 -- Shell基础 -- Bash变量【图】

LINUX - 相关标签

文件 - 相关标签

字段 - 相关标签

LINUX - 最新教程

LINUX - 最热教程