首页 / LINUX / linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？

linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1142字，纯文字阅读大概需要2分钟。

内容图文

linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？

我有大约15000个嵌套文件结构的图像,其名称是SKUS.我需要确保没有相同SKU的文件实际上是不同的文件.

例如,如果我有两个或多个名为MYSKU.jpg的文件,我需要确保它们之间没有任何不同.

在bash命令中执行此操作的最佳方法是什么？

解决方法:

我不想完全为你解决任务,但这里有一些有用的成分你可以尝试和整合：

find /path -type f   # gives you a list of all files in /path

你可以像这样遍历列表

for f in $(find /path -type f -name '*.jpg'); do
  ...
done

现在你可以想到你需要在循环中收集的东西.我建议

base=$(basename $f)
full_path=$f
hash=$(echo $f | md5sum | awk '{print $1}')

您现在可以将此信息存储在文件的三列中,以便每行包含您需要了解的有关文件的所有内容以查找重复项.

既然你没有解释你需要如何处理重复项,这里只是一个如何发现它们的建议.然后由你决定如何处理它们.

根据我们上面获得的列表,你可以存储它的两个副本：一个是按basename排序,另一个是按basename排序,不包括重复：

sort -k2    list.txt | column -t > list.sorted.txt       
sort -k2 -u list.txt | column -t > list.sorted.uniq.txt

这里我假设basename在第二列

现在运行

diff list.sorted.txt list.sorted.uniq.txt

查看具有相同名称的文件.从每一行开始,您现在可以提取MD5校验和,以验证它们是否真的不同,也是完整路径,以便执行某些操作,如mv,rm,ln等.

内容总结

以上是互联网集市为您收集整理的linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？全部内容，希望文章能够帮你解决linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/966125.html

来源：【匿名】

【上一篇】linux – mmap()：将旧内存重置为零非驻留状态【下一篇】Linux下安装GD

更多 ►

【linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？】教程文章相关的互联网学习教程文章

linux之eval用法(高级bash程序员的必修之技)

1. eval command-line 其中command－line是在终端上键入的一条普通命令行。然而当在它前面放上eval时，其结果是shell在执行命令行之前扫描它两次。如：pipe="|"eval ls $pipe wc -lshell第1次扫描命令行时，它替换出pipe的值｜，接着eval使它再次扫描命令行，这时shell把｜作为管道符号了。如果变量中包含任何需要shell直接在命令行中看到的字符（不是替换的结果），就可以使用eval。命令行结束符（；｜ &），I／o重定向符（< >）和...

【Linux相识相知】bash的基础特性【代码】【图】

命令历史shell进程会记录用户提交执行过的命令可以是用history查看：[root@localhost dev]# history 1 ss -tnl2ifconfig3vi /etc/sysconfig/network-scripts/ifcfg-ens33 4 reboot 5 systemctl stop firewalld6 systemctl disable firewalld7ifconfig8ifconfig9 startx10ping114.114.114.11411 top ......140who -b141who -r142date143w144 history 定制history的功能HISTSIZE：shell进程可以保留的命令历史的条数[root@lo...

linux下编译make文件报错“/bin/bash^M: 坏的解释器,使用grep快速定位代码位置【代码】【图】

一、linux下编译make文件报错“/bin/bash^M: 坏的解释器参考文章：http://blog.csdn.net/liuqiyao_01/article/details/41542101#comments自己测试的结果：【1】使用windows 下的编辑工具新建文件doc2unix.sh #!/usr/bin/env bash # test PID=$(ps -aef | grep nginx | grep -v grep | grep master |awk‘{print $2}‘) echo $PID在linux 下使用cat -v 查看红色部分为问题的根据所在【2】使用linux 的工具doc2unix 转换一下继续测试...

小白的linux笔记7：批量运行复杂的linux命令组合——BASH简单使用法【代码】

linux的BASH就相当于windows下的BAT文件，可以批处理命令。比如写好一个python脚本后，需要在运行时候加参数，但这个参数又不想每次输入，就可以用BASH的方式写好整条命令，然后直接运行.sh文件就可以了。建立.sh文件：（其实用其他后缀名也不影响）#!/bin/bash echo"Hello World !"第一行：告诉linux是用什么什么解释器来执行，即使用哪一种 Shell。 Linux 的 Shell 种类众多，常见的有：C Shell（/usr/bin/csh）、K Shell（/usr/...

马哥linux学习笔记（bash变量配置）

bash：解释器，编译器配置文件，生效范围划分，存在两类：全局配置：/etc/profile,/etc/profile.d/*.sh/etc/bashrc个人配置：~/.bash_profile~/.bashrc 按功能划分，存在两类：profile类：为交互式登录的shell提供配置/etc/profile,/etc/profile.d/*.sh~/.bash_profile 功用：(1) 定义环境变量，例如PATH、PS1(2) 运行命令或脚本 bashrc类：为非交互式登录shell提供配置/etc/bashrc ~/.bashrc 功用：(1) 定义命令别名；(2) 定义本地...

linux下Bash编程循环语句特殊用法之编写脚本(十)

linux下Bash编程while语句特殊用法之编写脚本(十)1.循环控制： break:中断整个循环语句，即退出循环后执行脚本后面的语句 continue:中断当前本次循环，提前进入下一轮循环 exit:结束脚本运行2.while死循环，即当不知道循环多少次时格式 : while :; do 循环语句 done3.while从输入重定向文件中每行读取并赋值给read变量格式: while read LINE;do 循环语句 done < 路径文件4.实例脚本 4.1.找出/etc/pas...

2018-3-6Linux系统管理(8)压缩与解压缩工具、bash交互【代码】

回顾上一章所学到的内容有如何制作软RAID及LVM，在生产环境中，软RAID一点用处都是没有的，关键是要了解一下RAIDLevel的机制，及等级意义是什么。另一个就是LVM，那么LVM就是一个逻辑设备，提供卷管理操作(volume)，将一个或多个底层物理设备，组织成为逻辑设备。在逻辑卷中有一种为快照的功能，而快照功能就是让我们在备份文件时更加流畅而设定的，其本身就不具有备份功能。那么在接下来的章节中讲述的是压缩与解压缩的工具。一、...

Linux基础之bash脚本进阶篇-数组【代码】

数组什么是数组？计算机中的数组指的是具有相同类型的若干变量按照一定的顺序组织起来的一种数据类型。通俗点来说数组就是变量的一种，按现在的术语来说就是变量圈子中的一个，只不过这个变量圈子都是相同类型的变量并有一定的组织顺序。数组的格式array[key]=valuearray：表示数组变量的名称key：表示数组元素的索引又称下标value：表示key对应的数组元素的值大体了解了什么是数组，下面就来了解下如何定义数组或如何创建数组定义...

linux环境变量 bash_profile

linux环境变量 bash_profile[root@iZ23uewresmZ ~]# vi /root/.bash_profile<pre># .bash_profile# Get the aliases and functions 如果有~/.bashrc这个文件就运行他if [ -f ~/.bashrc ]; then . ~/.bashrcfi# User specific environment and startup programs 所有环境变量路径要用:冒号分开不是分好这个跟win不一样PATH=$PATH:$HOME/bin:/usr/local/mysql/bin:/usr/local/mysql/libexport PATH</pre>还有运行下更新代...

Linux的Bash Shell详解【图】

一、Bash Shell概述　　1.什么是bash 　　bash是Bourne Again Shell的简称，是从unix系统中的sh发展而来的，是用户和Linux内核交互的工具，用户通过bash操作内核完成系统的使用和管理。　　2.shell的种类　　/bin/sh(已经被/bin/bash替代) 　　/bin/bash(默认的shell) 　　/bin/ksh(源自贝尔实验室，兼容bash) 　　/bin/tcsh(整合C shell,功能更为强大) 　　/bin/csh(已经被tcsh取代) ...

linux下vim和bash配置文件源文件【代码】【图】

1. ~/.vimrc "去掉讨厌的有关vi一致性模式，避免以前版本的一些bug和局限 set nocompatible set autoread " 文件修改之后自动载入 set completeopt=longest,menu " 自动完成 set history=1000 "记录历史的行数 set backspace=2 " 设置退格键可用，正常处理indent, eol, start等 set vb t_vb= "当vim进行编辑时，如果命令错误，会发出警报，该设置去掉警报 filetype on " 检...

Linux中profile、bashrc、bash_profile之间的区别和联系

/etc/profile:此文件为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行.并从/etc/profile.d目录的配置文件中搜集shell的设置. 英文描述为： # /etc/profile # System wide environment and startup programs, for login setup# Functions and aliases go in /etc/bashrc # It‘s NOT a good idea to change this file unless you know what you# are doing. It‘s much better to create a custom.sh shell script in...

【转】Linux 之 /etc/profile、~/.bash_profile 等几个文件的执行过程

原文网址：http://blog.csdn.net/ithomer/article/details/6322892在登录Linux时要执行文件的过程如下：在刚登录Linux时，首先启动 /etc/profile 文件，然后再启动用户目录下的 ~/.bash_profile、 ~/.bash_login或 ~/.profile文件中的其中一个，执行的顺序为：~/.bash_profile、 ~/.bash_login、 ~/.profile。如果 ~/.bash_profile文件存在的话，一般还会执行 ~/.bashrc文件。因为在 ~/.bash_profile文件中一般会有下面的代码：if ...

linux 执行 shell 文件报错 /usr/bin/env: "bash\r"【代码】

1.#!/usr/bin/env在脚本中的作用在 linux 的一些脚本，需在开头一行指定脚本的解释程序，如：#!/usr/bin/env bash#!/usr/bin/bash#!/usr/bin/env python 告诉操作系统执行这个脚本的时候，调用 /usr/bin 下的 python 解释器；#!/usr/bin/python　　告诉操作系统到 env 设置里查找 python 的安装路径，再调用对应路径下的解释器程序完成操作 2./usr/bin/env: "bash\r"解决linux 中用 vim 打开 sh 脚本文件，重新设置文件的格式：s...

Linux下环境变量配置方法梳理（.bash_profile和.bashrc的区别）

https://www.cnblogs.com/kevingrace/p/8072860.html当你登录并且登录shell是bash时,bash首先执行/etc/profile文件中的命令(如果该文件存在),然后它顺序寻找~ /.bash_profile,~/.bash_login或~/.profile文件,并执行找到的第一个可读文件中的命令.当登录bash退出时,它将执行~/.bash_logout文件中的命令.当启动一个交互的bash时,它将执行~/.bashrc文件中的命令(如果该文件存在并且可读).当非交互地启动以运行一个shell脚本时,bash将...

递归 - 相关标签

递归查询递归调用递归迭代递归方法递归函数递归和迭代递归神经网络递归算法递归下降

LINUX - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...VMware中Linux虚拟机挂载主机共享文件夹...Linux双网卡配置虚拟机下Linux安装好Nginx后，宿主机无...linux下安装postgresql并配置远程图形桌...Linux命令--exportfs命令详解 linux 终端printf打印显示乱码问题修正 Linux下Shell的for循环语句N种写法 Linux下创建nginx脚本-start、stop、re...SUSELinux安装MySQL

首页 / LINUX / linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？

linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？

内容导读

内容图文

内容总结

内容备注

内容手机端

【linux – 使用bash以递归方式查找具有相同名称但实际上不同的文件的最佳方法？】教程文章相关的互联网学习教程文章

linux之eval用法(高级bash程序员的必修之技)

【Linux相识相知】bash的基础特性【代码】【图】

linux下编译make文件报错“/bin/bash^M: 坏的解释器,使用grep快速定位代码位置【代码】【图】

小白的linux笔记7：批量运行复杂的linux命令组合——BASH简单使用法【代码】

马哥linux学习笔记（bash变量配置）

linux下Bash编程循环语句特殊用法之编写脚本(十)

2018-3-6Linux系统管理(8)压缩与解压缩工具、bash交互【代码】

Linux基础之bash脚本进阶篇-数组【代码】

linux环境变量 bash_profile

Linux的Bash Shell详解【图】

linux下vim和bash配置文件源文件【代码】【图】

Linux中profile、bashrc、bash_profile之间的区别和联系

【转】Linux 之 /etc/profile、~/.bash_profile 等几个文件的执行过程

linux 执行 shell 文件报错 /usr/bin/env: "bash\r"【代码】

Linux下环境变量配置方法梳理（.bash_profile和.bashrc的区别）

LINUX - 相关标签

递归 - 相关标签

文件 - 相关标签

LINUX - 最新教程

LINUX - 最热教程