首页 / PYTHON / pythondifflib模块详解

pythondifflib模块详解

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了pythondifflib模块详解，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3618字，纯文字阅读大概需要6分钟。

内容图文

这篇文章主要为大家详细介绍了python difflib模块的示例，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

difflib模块提供的类和方法用来进行序列的差异化比较，它能够比对文件并生成差异结果文本或者html格式的差异化比较页面，如果需要比较目录的不同，可以使用filecmp模块。

class difflib.SequenceMatcher

此类提供了比较任意可哈希类型序列对方法。此方法将寻找没有包含‘垃圾'元素的最大连续匹配序列。

通过对算法的复杂度比较，它由于原始的完形匹配算法，在最坏情况下有n的平方次运算，在最好情况下，具有线性的效率。

它具有自动垃圾启发式，可以将重复超过片段1%或者重复200次的字符作为垃圾来处理。可以通过将autojunk设置为false关闭该功能。

class difflib.Differ

此类比较的是文本行的差异并且产生适合人类阅读的差异结果或者增量结果，结果中各部分的表示如下：

pythondifflib模块详解 - 文章图片

class difflib.HtmlDiff

此类可以被用来创建HTML表格 (或者说包含表格的html文件) ，两边对应展示或者行对行的展示比对差异结果。

make_file(fromlines, tolines [, fromdesc][, todesc][, context][, numlines])

make_table(fromlines, tolines [, fromdesc][, todesc][, context][, numlines])

以上两个方法都可以用来生成包含一个内容为比对结果的表格的html文件，并且部分内容会高亮显示。

difflib.context_diff(a, b[, fromfile][, tofile][, fromfiledate][, tofiledate][, n][, lineterm])

比较a与b(字符串列表)，并且返回一个差异文本行的生成器
示例：

>>> s1 = ['bacon\n', 'eggs\n', 'ham\n', 'guido\n']
>>> s2 = ['python\n', 'eggy\n', 'hamster\n', 'guido\n']
>>> for line in context_diff(s1, s2, fromfile='before.py', tofile='after.py'):
...   sys.stdout.write(line) 
*** before.py
--- after.py
***************
*** 1,4 ****
! bacon
! eggs
! ham
 guido
--- 1,4 ----
! python
! eggy
! hamster
 guido

difflib.get_close_matches(word, possibilities[, n][, cutoff])

返回最大匹配结果的列表

示例：

>>> get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'])
['apple', 'ape']
>>> import keyword
>>> get_close_matches('wheel', keyword.kwlist)
['while']
>>> get_close_matches('apple', keyword.kwlist)
[]
>>> get_close_matches('accept', keyword.kwlist)
['except']

difflib.ndiff(a, b[, linejunk][, charjunk])

比较a与b(字符串列表)，返回一个Differ-style 的差异结果
示例：

>>> diff = ndiff('one\ntwo\nthree\n'.splitlines(1),
...       'ore\ntree\nemu\n'.splitlines(1))
>>> print ''.join(diff),
- one
? ^
+ ore
? ^
- two
- three
? -
+ tree
+ emu

difflib.restore(sequence, which)

返回一个由两个比对序列产生的结果

示例

>>> diff = ndiff('one\ntwo\nthree\n'.splitlines(1),
...       'ore\ntree\nemu\n'.splitlines(1))
>>> diff = list(diff) # materialize the generated delta into a list
>>> print ''.join(restore(diff, 1)),
one
two
three
>>> print ''.join(restore(diff, 2)),
ore
tree
emu

difflib.unified_diff(a, b[, fromfile][, tofile][, fromfiledate][, tofiledate][, n][, lineterm])

比较a与b(字符串列表)，返回一个unified diff格式的差异结果.

示例：

>>> s1 = ['bacon\n', 'eggs\n', 'ham\n', 'guido\n']
>>> s2 = ['python\n', 'eggy\n', 'hamster\n', 'guido\n']
>>> for line in unified_diff(s1, s2, fromfile='before.py', tofile='after.py'):
...  sys.stdout.write(line) 
--- before.py
+++ after.py
@@ -1,4 +1,4 @@
-bacon
-eggs
-ham
+python
+eggy
+hamster
 guido

实际应用示例

比对两个文件，然后生成一个展示差异结果的HTML文件

#coding:utf-8
'''
file:difflibeg.py
date:2017/9/9 10:33
author:lockey
email:lockey@123.com
desc:diffle module learning and practising 
'''
import difflib
hd = difflib.HtmlDiff()
loads = ''
with open('G:/python/note/day09/0907code/hostinfo/cpu.py','r') as load:
 loads = load.readlines()
 load.close()

mems = ''
with open('G:/python/note/day09/0907code/hostinfo/mem.py', 'r') as mem:
 mems = mem.readlines()
 mem.close()

with open('htmlout.html','a+') as fo:
 fo.write(hd.make_file(loads,mems))
 fo.close()

运行结果：

pythondifflib模块详解 - 文章图片

生成的html文件比对结果：

pythondifflib模块详解 - 文章图片

以上就是python difflib模块详解的详细内容，更多请关注Gxl网其它相关文章！

内容总结

以上是互联网集市为您收集整理的pythondifflib模块详解全部内容，希望文章能够帮你解决pythondifflib模块详解所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/426980.html

来源：【匿名】

【上一篇】Python套接字编程【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【pythondifflib模块详解】教程文章相关的互联网学习教程文章

【Python】文件目录比较工具filecmp和difflib【代码】【图】

在一些运维场景中，常常需要比较两个环境中的应用目录结构（是否有文件/目录层面上的增删）以及比较两个环境中同名文件内容的不同（即文件层面上的改）。Python自带了两个内建模块可以很好地完成这个工作，filecmp和difflib。前者主要用于比较目录结构上的不同以及笼统的文件内容比较；后者用于比较两个文件具体内容上的不同。综合使用两个模块可以比较完备地做一次比较。【filecmp】　　filecmp提供一些方法可以很方便地进行对比两...

第43天：Python filecmp&difflib模块【代码】【图】

本节主要介绍两个 Python 中常用于比较数据的模块，一个是 filecmp 模块，另一个是 difflib 模块。其中，前者主要用于比较文件及目录，后者主要用于比较序列的类和函数，下面具体介绍两者的区别。filecmp 模块filecmp 模块作为 Python 提供的标准库之一，无需安装，模块定义了用于比较文件及目录的函数，对服务器上的文件目录的校验非常实用。cmp(f1,f2)函数cmp(f1,f2)函数用于比较两个文件是否相同，如果 f1 和 f2 相等则返回True...

通过difflib modul比较python中的列表【代码】

我正在尝试difflib库.我有两个列表：L_1和L_2包含字符串.我想知道这些序列是否相似(顺序不重要).L_1 = ["Bob", "Mary", "Hans"] L_2 = ["Bob", "Marie", "Háns"]应该可以.但L_1 = ["Nirdosch", "Mary", "Rolf"] L_2 = ["Bob", "Marie", "Háns"]应该没关系. 我想到了遍历第一个列表L_1并通过该方法匹配L_1的每个元素的想法difflib.get_close_matches()针对第二个列表L_2.如果存在比值较大的匹配项,那么假设0.7将其从L_2中删除并继续...

C字符串diff(a la Python的difflib)【代码】

我正在尝试对两个字符串进行比较,以确定它们是否仅在字符串结构的一个数字子集中有所不同.例如,varies_in_single_number_field('foo7bar', 'foo123bar') # Returns True, because 7 != 123, and there's only one varying # number region between the two strings.在Python中,我可以使用difflib来完成此任务：import difflib, doctestdef varies_in_single_number_field(str1, str2):"""A typical use case is as follows:>>> var...

python-从difflib获取更细粒度的diff(或对diff进行后处理以实现相同效果的方法)【代码】

下载this页并对其进行较小的编辑,将本段中的前65更改为68：然后,我使用BeauifulSoup解析这两个源,并使用difflib对其进行比较.url = 'https://secure.ssa.gov/apps10/reference.nsf/links/02092016062645AM' response = urllib2.urlopen(url) content = response.read() # get response as list of linesurl2 = 'file:///Users/Pyderman/projects/temp/02092016062645AM-modified.html' response2 = urllib2.urlopen(url2) content...

Python中的高性能模糊字符串比较,使用Levenshtein或difflib【代码】

我正在进行临床信息规范化(拼写检查),其中我检查每个给定的单词对900,000字的医学词典.我更关注时间复杂度/性能. 我想做模糊字符串比较,但我不确定使用哪个库. 选项1：import Levenshtein Levenshtein.ratio('hello world', 'hello')Result: 0.625选项2：import difflib difflib.SequenceMatcher(None, 'hello world', 'hello').ratio()Result: 0.625在这个例子中,两者给出相同的答案.在这种情况下,你认为两者都表现相似吗？解决方...

python – 是否有一个替代`difflib.get_close_matches()`来返回索引(列表位置)而不是str列表？【代码】

我想使用像difflib.get_close_matches这样的东西,而不是最相似的字符串,我想获得索引(即列表中的位置). 列表的索引更灵活,因为可以将索引与其他数据结构相关联(与匹配的字符串相关). 例如,而不是：>>> words = ['hello', 'Hallo', 'hi', 'house', 'key', 'screen', 'hallo', 'question', 'format'] >>> difflib.get_close_matches('Hello', words) ['hello', 'hallo', 'Hallo']我想要：>>> difflib.get_close_matches('Hello', wor...

python – SequenceMatcher.ratio如何在difflib中工作【代码】

我正在尝试python的difflib模块,我遇到了SequenceMatcher.所以,我尝试了以下示例,但无法理解发生了什么.>>> SequenceMatcher(None,"abc","a").ratio() 0.5>>> SequenceMatcher(None,"aabc","a").ratio() 0.4>>> SequenceMatcher(None,"aabc","aa").ratio() 0.6666666666666666现在,根据ratio：Return a measure of the sequences’ similarity as a float in the range[0, 1]. Where T is the total number of elements in both se...

Python入门之时间模块、datetime模块、difflib文件对比模块、sys模块【图】

一.时间模块导入：import times = '2019-7-14' print(time.strptime(s,'%Y-%m-%d')) s_time = '09:00:00' print(time.strptime(s_time,'%H:%M:%S')) 1.把元组的时间转换为时间戳tuple_time = time.localtime() print(tuple_time) print(time.mktime(tuple_time))2.把元组时间转换为字符串时间print(time.strftime('%m-%d',tuple_time)) print(time.strftime('%Y-%m-%d',tuple_time)) print(time.strftime('%F',tuple_time)) pri...

python – 如何使用difflib.SequenceMatcher获取多个匹配项？【代码】

我使用difflib来识别较长序列中短字符串的所有匹配项.但是,当有多个匹配时,difflib似乎只返回一个：> sm = difflib.SequenceMatcher(None, a='ACT', b='ACTGACT') > sm.get_matching_blocks() [Match(a=0, b=0, size=3), Match(a=3, b=7, size=0)]我预期的输出是：[Match(a=0, b=0, size=3), Match(a=0, b=4, size=3), Match(a=3, b=7, size=0)]事实上,字符串ACTGACT包含两个ACT匹配,位于0和4位,大小为3(在字符串末尾加上另一个大小...

Python使用difflib模块比较两个文件内容异同，同时输出html易浏览【代码】

因工作需求，需要对比连个文件异同，并输出html格式来对比。 #!/usr/bin/python # -*- coding: utf-8 -*-import sys import difflibdef read_file(filename):try:with open(filename, 'r') as f:return f.readlines()except IOError:print("ERROR: 没有找到文件:%s或读取文件失败！" % filename)sys.exit(1)def compare_file(file1, file2, out_file):file1_content = read_file(file1)file2_content = read_file(file2)d = diffli...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / pythondifflib模块详解

pythondifflib模块详解

内容导读

内容图文

内容总结

内容备注

内容手机端

【pythondifflib模块详解】教程文章相关的互联网学习教程文章

【Python】文件目录比较工具filecmp和difflib【代码】【图】

第43天：Python filecmp&difflib模块【代码】【图】

通过difflib modul比较python中的列表【代码】

C字符串diff(a la Python的difflib)【代码】

python-从difflib获取更细粒度的diff(或对diff进行后处理以实现相同效果的方法)【代码】

Python中的高性能模糊字符串比较,使用Levenshtein或difflib【代码】

python – 是否有一个替代`difflib.get_close_matches()`来返回索引(列表位置)而不是str列表？【代码】

python – SequenceMatcher.ratio如何在difflib中工作【代码】

Python入门之时间模块、datetime模块、difflib文件对比模块、sys模块【图】

python – 如何使用difflib.SequenceMatcher获取多个匹配项？【代码】

Python使用difflib模块比较两个文件内容异同，同时输出html易浏览【代码】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程