首页 / LINUX / linux-打印文件1与文件2的差异,而不从文件2中删除任何内容

linux-打印文件1与文件2的差异,而不从文件2中删除任何内容

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了linux-打印文件1与文件2的差异,而不从文件2中删除任何内容，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4416字，纯文字阅读大概需要7分钟。

内容图文

我正在创建一个脚本,用于从a.csv日志文件中针对预定义的黑色IP列表搜索IP.

它首先导入日志文件,然后从中解析IP,然后针对预定义的黑色IP列表搜索解析的IP,最后需要询问用户(如果找到任何结果)将结果保存到导入的原始日志文件中.

文件1是代码中IP-output.csv的示例.

文件2是代码中$filename的示例(原始导入的.csv).

文件1：

107.147.166.60 ,SUSPICIOUS IP
107.147.167.26 ,SUSPICIOUS IP
108.48.185.186 ,SUSPICIOUS IP
108.51.114.130 ,SUSPICIOUS IP
142.255.102.68 ,SUSPICIOUS IP

档案2：

outlook.office365.com ,174.203.0.118 ,UserLoginFailed
outlook.office365.com ,107.147.166.60 ,UserLoginFailed
outlook.office365.com ,107.147.167.26 ,UserLoginFailed
outlook.office365.com ,174.205.17.24 ,UserLoginFailed
outlook.office365.com ,108.48.185.186 ,UserLoginFailed
outlook.office365.com ,174.226.15.21 ,UserLoginFailed
outlook.office365.com ,108.51.114.130 ,UserLoginFailed
outlook.office365.com ,67.180.23.93 ,UserLoginFailed
outlook.office365.com ,142.255.102.68 ,UserLoginFailed
outlook.office365.com ,164.106.75.235 ,UserLoginFailed

我想将文件2更改为：

outlook.office365.com ,174.203.0.118 ,UserLoginFailed
outlook.office365.com ,107.147.166.60 ,UserLoginFailed ,SUSPICIOUS IP
outlook.office365.com ,107.147.167.26 ,UserLoginFailed ,SUSPICIOUS IP
outlook.office365.com ,174.205.17.24 ,UserLoginFailed
outlook.office365.com ,108.48.185.186 ,UserLoginFailed ,SUSPICIOUS IP
outlook.office365.com ,174.226.15.21 ,UserLoginFailed
outlook.office365.com ,108.51.114.130 ,UserLoginFailed ,SUSPICIOUS IP
outlook.office365.com ,67.180.23.93 ,UserLoginFailed
outlook.office365.com ,142.255.102.68 ,UserLoginFailed ,SUSPICIOUS IP
outlook.office365.com ,164.106.75.235 ,UserLoginFailed

这是我创建的脚本：

#!/bin/bash
#
# IP Blacklist Checker
#Import .csv (File within working directory)
echo "Please import a .csv log file to parse/search the IP(s) and UserAgents: "
read filename
#Parsing IPs from .csv log file
echo "Parsing IP(s) from imported log file..."
grep -Eo '([0-9]{1,3}\.){3}[0-9]{1,3}' $filename | sort | uniq > IP-list.txt
echo 'Done'
awk 'END {print NR,"IP(s) Found in imported log file"}' IP-list.txt
echo 'IPs found in imported log file:'
cat IP-list.txt
#searches parsed ip's against blacked ip lists
echo 'Searching parsed IP(s) from pre-defined Blacked IP List Databases...'
fgrep -w -f "IP-list.txt" "IPlist.txt" > IP-output.txt
awk 'END {print NR,"IP(s) Found Blacked IP List Databases"}' IP-output.txt
echo 'Suspicious IPs found in Blacked IP List Databases:'
cat IP-output.txt
while true; do
read -p "Do you want to add results to log file?" yn
case $yn in
    [Yy]* ) grep -Ff IP-output.txt $filename | sed 's/$/ ,SUSPICIOUS IP/' > IP-output.csv && awk 'FNR==NR {m[$1]=$0; next} {for (i in m) {match($0,i); val=substr($0, RSTART, RLENGTH); if (val) {sub(val, m[i]); print; next}};} 1' IP-output.csv $filename > $filename; break;;
    [Nn]* ) break;;
    * ) echo "Please answer yes or no.";;
esac
done
echo "Finished searching parsed IP(s) from pre-defined Blacked IP List Databases."
rm IP-list.txt IP-output.csv IP-output.txt

我要导入的日志文件真的很长,只有15到20列,并且IPlist.txt(涂黑的IP)中包含超过15000个IP.将结果保存到相同的日志文件后,.csv文件将为空,如果我将其保存为其他名称,则所有列均乱序,并且IP列旁边会出现“ SUSPICIOUS IP”列,而是需要它位于最后一列(行的末尾).

我还不知道如何仅在发现任何内容后才提示保存文件,如果不仅提示什么也没有提示！

我得到的结果：

 outlook.office365.com ,174.203.0.118 ,UserLoginFailed
 outlook.office365.com ,107.147.166.60 ,SUSPICIOUS IP ,UserLoginFailed
 outlook.office365.com ,107.147.167.26 ,SUSPICIOUS IP ,UserLoginFailed
 outlook.office365.com ,174.205.17.24 ,UserLoginFailed
 outlook.office365.com ,108.48.185.186 ,SUSPICIOUS IP ,UserLoginFailed
 outlook.office365.com ,174.226.15.21 ,UserLoginFailed
 outlook.office365.com ,108.51.114.130 ,SUSPICIOUS IP ,UserLoginFailed
 outlook.office365.com ,67.180.23.93 ,UserLoginFailed
 outlook.office365.com ,142.255.102.68 ,SUSPICIOUS IP ,UserLoginFailed
 outlook.office365.com ,164.106.75.235 ,UserLoginFailed

解决方法:

您的意思是这样的：

awk 'FNR==NR { m[$1]=$0; next; } { for (i in m) { idx = index($0, i); if (idx > 0) { print substr($0, 1, idx-1) m[i]; next; } } } 1' file1.txt file2.txt > newfile2.txt

它基本上按顺序处理file1.txt和file2.txt.对于第一个文件中的所有行,FNR == NR为true,其中映射m用替换模式构建(第一个空间映射到整行之前的所有内容).对于第二个文件,将检查每行中以m为单位的匹配项.如果存在匹配项(使用index()),则脚本会在匹配项之前打印所有内容,然后打印m中的值.哦,最后1将打印file2中不匹配的行.

内容总结

以上是互联网集市为您收集整理的linux-打印文件1与文件2的差异,而不从文件2中删除任何内容全部内容，希望文章能够帮你解决linux-打印文件1与文件2的差异,而不从文件2中删除任何内容所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/949663.html

来源：【匿名】

【上一篇】linux-脚本以获取具有最多内存使用量的进程的用户？【下一篇】Linux下安装GD

更多 ►

【linux-打印文件1与文件2的差异,而不从文件2中删除任何内容】教程文章相关的互联网学习教程文章

Linux命令之终端打印 - echo

echo 是用于终端打印的基本命令。使用如下：$ echo ”hello world”$ echo hello world$ echo ’hello world’$ echo $PATH [命名说明]默认情况下，echo会在每行结尾添加一个换行符号;使用选项 -n来忽略行尾的换行符;叹号(!)属于特殊符号，若字符串有叹号，则不应将其放到双引号(””)中，可以不使用双引号或使用单引号，还可以使用转义字符; 如下：$ echo hello world !$ echo ’hello world !’$ echo ”hello world \!”使用不带...

【shell】Linux shell 之打印99乘法表详解【代码】

打印99乘法表在任何语言中都是一个必写的程序，特别是学习了循环之后。打印99乘法表第一步众所周知，99乘法表的格式为x * y = z所以我们至少需要两个参数，一个为x，一个为y，这里我们使用 i 和 j 来表示。x 和 y 都不会超过 9 ，并具有一定的规律，比如 1 x 2,1 x 3 根据上面的分析，我们首先需要把 i 和 j 先写出来，写就需要用到我们的双层for循环了。 #!/bin/bash - for i in `seq 9` dofor j in `seq 9`doecho $j,$idonedone ...

模拟linux开机服务检测打印效果【代码】【图】

linux开机检测服务状态后显示成功或者是失败的状态。有没有发现，不管服务的名称长短，最后那一段都能对齐显示呢？我们能不能写个脚本去模拟一下呢？^_^ 来我们首先来分析一下：首先，确定一下当前终端的宽度其次，确定一下服务状态显示所占的字符数再次，确定一下服务名称所占的字符数剩余的就是打印空格了现在思路有了，咱们来写脚本吧，编辑service_status.sh#!/bin/bash # #获取当前终端的宽度 COLUMNS=`resize -u | grep "COL...

Linux终端打印文本色彩

在终端生成彩色，可以使用转义序列实现；　　每种颜色都有对应的颜色码，比如：重置=0，黑色=30，红色=31，绿色=32，黄色=33，蓝色=34，洋红=35，青色=36，白色=37.　　要打印彩色文本，可输入如下命令：　　echo -e "\e[1;31m This is red text \e[0m"　　\e[1;31将颜色设为红色，\e[0m将颜色重新置回，只需要将31替换想要的颜色码就可以了。　　要设置彩色背景，经常使用的颜色码是:重置=0，黑色=40，红色=41，绿色=42，黄色=43，...

linux执行python命令后没有反应，不打印日志信息【图】

实际的python执行的软连接是路径是/opt/python2.7/bin/python，而设置的软连接错误如下：修改该连接，是python指向/opt/python2.7/bin/python，?lrwxrwxrwx.?1?root?root?25?Jan?29?16:53?python?->?/opt/python2.7/bin/python ?

Linux下tomcat日志打印和传参乱码问题【图】

当前环境： Linux内核：Ubuntu（乌班图） SSH连接工具：SecureCRT 1、首先确认Linux系统编码： Linux命令：locale 若查询结果不是zh_CN.UTF-8，则修改系统编码。 Linux命令：vi /etc/default/locale 修改LANG的值为zh_CN.UTF-8 保存之后重启服务器，命令：reboot 2、设置CRT的显示编码：设置字符编码为：UTF-8。选择“字体”，并设置字符集为：中文GB2312。断开SSH连接，重新连接。 1、Tomcat日志打印乱码：进入tomcat安装目...

很实用的linux的3个日志打印（必掌握）【图】

1、tail -f 日志文件–动态打印最近日志文件。tail -300f 日志文件，即动态打印最后n行（这里举例是300行）日志文件。2、grep -C 100 key filename–搜索打印出关键词在日志文件前后n行的日志。3、tail -300f 日志文件 |grep ‘关键词’ 一直动态打印某个关键词的日志文件。当线上出现问题时，你知道关键错误日志是什么，又可以知道触发此错误日志的方式，很好用。点赞收藏分享文章举报史莱克棋怪发布了2 篇原创文章 · 获赞 0 ...

linux-打印到内核日志的限制

我正在使用Linux设备驱动程序(内核版本2.6.32-37).我主要通过打印到内核日志(使用printk)来调试代码.一切正常,直到我的计算机突然停止响应.我已经一遍又一遍地检查了它,我的代码似乎是正确的.我的问题是：内核日志中的打印过多是否有可能导致计算机停止响应？非常感谢！ Omer解决方法:我怀疑问题是由printk引起的,当然使用printk本身会减慢整个代码的速度,但不会使系统崩溃. 以下是Ubuntu Kernel Debugging Trick年代的报价：内部...

linux tomcat打印gc日志【代码】

编辑bin目录下的catalina.sh文件，在 #!/bin/sh下添加以下内容JAVA_OPTS=" -XX:+PrintGCTimeStamps -XX:+PrintGCDetails -Xloggc:/root/gc.log" 可以通过在线工具对gc日志进行分析地址：https://gceasy.io/

Linux C语言程序：接受用户的输入，并将用户的输入打印出来【代码】

Linux C语言程序：接受用户的输入，并将用户的输入打印出来代码内容如下： #include<stdio.h> #include<stdlib.h> static char buff[256]; static char *string; int main() {printf("Please input s string\n");string=buff;fgets(string,256,stdin);printf("\n Your string is：%s\n",string); }

Linux下使用jq友好的打印JSON技巧分享_javascript技巧

之前在命令行下面打印JSON的时候统统都是Cat，然后将结果复制到支持JSON解析的编辑器里面，非常曲折。简单的搜索了一下之后，在StackOverflow上找到了一篇文章。支持率最高的那个答案需要Python2.6+的支持，可是服务器上的版本为2.4，升级之后的影响不可预料，遂放弃。继续看下面的答案，有一个叫jq的小工具貌似还不错，下载下来测试确实能满足要求。 #cat food.json | jq . 即可获得格式化好的结果给大家详细介绍下jq吧 jq官网...

Linux下使用jq友好的打印JSON技巧分享

LINUX GDB: IDENTIFY MEMORY LEAKS（通过gdb脚本打印malloc和free）

下面为一种方法查找memory leak，但在实际使用过程中由于打印太多会导致效率很低，不是很实用，而且有些地方报错如 *(malloc+191) 本文系统来源：https://www.cnblogs.com/wangshaowei/p/14063608.html

LINUX GDB: IDENTIFY MEMORY LEAKS（通过gdb脚本打印malloc和free）

37.Linux应用调试-修改内核来打印用户态的oops【代码】【图】

1.在之前第32章里,我们学习了通过驱动的oops定位错误代码行oops代码如下所示:Unable to handle kernel paging request at virtual address 56000050　　　　　　//无法处理内核页面请求的虚拟地址56000050pgd = c3850000[56000050] *pgd=00000000Internal error: Oops: 5 [#1]　　　　　　　　//内部错误oopsModules linked in: 26th_segmentfault//表示内部错误发生在26th_segmentfault.ko驱动模块里CPU: 0 Not tainted (2.6....

LINUX - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...VMware中Linux虚拟机挂载主机共享文件夹...Linux双网卡配置虚拟机下Linux安装好Nginx后，宿主机无...linux下安装postgresql并配置远程图形桌...Linux命令--exportfs命令详解 linux 终端printf打印显示乱码问题修正 Linux下Shell的for循环语句N种写法 Linux下创建nginx脚本-start、stop、re...SUSELinux安装MySQL

首页 / LINUX / linux-打印文件1与文件2的差异,而不从文件2中删除任何内容

linux-打印文件1与文件2的差异,而不从文件2中删除任何内容

内容导读

内容图文

内容总结

内容备注

内容手机端

【linux-打印文件1与文件2的差异,而不从文件2中删除任何内容】教程文章相关的互联网学习教程文章

Linux命令之终端打印 - echo

【shell】Linux shell 之打印99乘法表详解【代码】

模拟linux开机服务检测打印效果【代码】【图】

Linux终端打印文本色彩

linux执行python命令后没有反应，不打印日志信息【图】

Linux下tomcat日志打印和传参乱码问题【图】

很实用的linux的3个日志打印（必掌握）【图】

linux-打印到内核日志的限制

linux tomcat打印gc日志【代码】

Linux C语言程序：接受用户的输入，并将用户的输入打印出来【代码】

Linux下使用jq友好的打印JSON技巧分享_javascript技巧

Linux下使用jq友好的打印JSON技巧分享

LINUX GDB: IDENTIFY MEMORY LEAKS（通过gdb脚本打印malloc和free）

LINUX GDB: IDENTIFY MEMORY LEAKS（通过gdb脚本打印malloc和free）

37.Linux应用调试-修改内核来打印用户态的oops【代码】【图】

LINUX - 相关标签

文件 - 相关标签

LINUX - 最新教程

LINUX - 最热教程