哈希算法实现字符串匹配

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了哈希算法实现字符串匹配，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3858字，纯文字阅读大概需要6分钟。

内容图文

对于匹配字符串m和目标字符串n，最朴素的思想就是对于每个起始位置都o（m）地直接比较字符是否相同，最后时间复杂度为O（m*n）这样的时间复杂度在大多数时候都很不乐观，因此需要一些技巧降低时间复杂度。

哈希算法：

我们可以将一段字符串映射为数值然后比较数值大小，若相等则匹配成功。这是理想情况下的，要达到这样的效果需要哈希算法具备一定的抗碰撞性（即不同的字符串不会映射到同一数值）。在这个前提下，要是计算每个长度为m的字符串的哈希值，最终复杂度必然还是O（m*n），这里可以用滚动哈希的方法优化。

对于匹配字符串 s=C?C?C?.....C? 哈希值H=C?*B^(m-1)+C?*B^(m-2)+C?*B^(m-3)+...+C? 其中B取一个非常大素数如（1e9+7），B^(m-1)表示B的m-1次方

对于目标字符串ss=A?A?A?....A? 已知A?开始长度为m的字符串的哈希值为h ，要得到A?开始长度为m的字符串的哈希值只需

h′ = h*B-A?*B^m+D 　　　　　其中D为第（m+1）位字符，就可以在O（n）的时间复杂度内实现字符串匹配

例题：POJ? 3690

先上代码：

 1 #include<iostream>
 2 #include<algorithm>
 3 #include<string>
 4 #include<set>
 5 #include<vector>
 6 #include<queue>
 7 #include<stack>
 8 #include<map>
 9 #include<cmath>
10 #include<string>
11 using namespace std;
12 typedef unsigned long long ull;
13 char s[1010][1010];
14 char pat[110][55][1010];
15 ull hash_[1010][1010], temp[1010][1010];
16 const ull B = 1e9 + 7, A = 9973;
17 int N, M, P, Q, T;
18 void comput_hash(char a[][1010], int n, int m)
19 {
20     int i, j, k;
21     ull e = 0, t1 = 1, t2 = 1;
22     for (i = 1; i <= Q; i++)
23         t1 *= A;
24     for (i = 1; i <= n; i++)
25     {
26         e = 0;
27         for (j = 1; j <= Q; j++)
28             e = e * A + a[i][j];
29         for (j = 1; j + Q - 1 <= m; j++)
30         {
31             temp[i][j] = e;
32             if (j + Q <= m)
33                 e = e * A - a[i][j] * t1 + a[i][j + Q];
34         }
35     }
36 
37     e = 0;
38     for (i = 1; i <= P; i++)
39         t2 *= B;
40     for (j = 1; j + Q - 1 <= m; j++)
41     {
42         e = 0;
43         for (i = 1; i <= P; i++)
44             e = e * B + temp[i][j];
45         for (i = 1; i + P - 1 <= n; i++)
46         {
47             hash_[i][j] = e;
48             if (i + P <= n)
49                 e = e * B - temp[i][j] * t2 + temp[i + P][j];
50         }
51     }
52 }
53 int main()
54 {
55     int i, j, k;
56     int cnt = 0, ans;
57     while (~scanf("%d%d%d%d%d", &N, &M, &T, &P, &Q))
58     {
59         if (N == 0 && M == 0 && P == 0 && Q == 0 && T == 0)
60             break;
61         for (i = 1; i <= N; i++)
62             scanf("%s", s[i] + 1);
63         for (k = 1; k <= T; k++)
64             for (i = 1; i <= P; i++)
65                 scanf("%s", pat[k][i] + 1);
66 
67         multiset<ull>ml;
68         for (i = 1; i <= T; i++)
69         {
70             comput_hash(pat[i], P, Q);
71             ml.insert(hash_[1][1]);
72         }
73 
74         comput_hash(s, N, M);
75         for (i = 1; i + P - 1 <= N; i++)
76             for (j = 1; j + Q - 1 <= M; j++)
77                 ml.erase(hash_[i][j]);
78 
79         ans = T - ml.size();
80         printf("Case %d: %d\n", ++cnt, ans);
81     }
82     return 0;
83 }

对于这道题，我们可以先只看一个维度，对于一个维度的匹配就是简单的板子题，就像之前所说进行匹配即可，在拓展到二维时，应该考虑行列均相同。

按一个维度的思想，我们要保证一个字符相同，然后是一段字符相同。

这里我们可以将每一行的一段字符串的哈希值视为“一个字符”’（哈希算法需要足够抗碰撞允许我们这么做）

然后我们继续在列方向上进行匹配即可。

在代码中用unsigned long long 来存哈希值能让数据自然溢出，若不用ull，则应在数据溢出前模上一个足够大的素数，

以B=1e9+7 作为行的基数 A=9973作为列的基数

先计算每个匹配模式的hash值，放入multiset里，hash[ i ][ j ]表示以从 i 到 i+P ，j 到 j+Q的匹配模式的哈希值

再计算匹配对象的，然后将匹配对象中出现过的hash值从multiset里剔除，

此时在multiset里剩下的就是未在匹配对象出现过的匹配模式的个数

那么答案就是用匹配模式的个数 T 减去multiset里元素个数

参考书籍————《挑战程序设计竞赛》

内容总结

以上是互联网集市为您收集整理的哈希算法实现字符串匹配全部内容，希望文章能够帮你解决哈希算法实现字符串匹配所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/620075.html

来源：【匿名】

【上一篇】算法竞赛入门经典第二版第一章习题-(练习Java和C++语法)【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【哈希算法实现字符串匹配】教程文章相关的互联网学习教程文章

题目：给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict，判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。说明：拆分时可以重复使用字典中的单词。你可以假设字典中没有重复的单词。示例 1：输入: s = "leetcode", wordDict = ["leet", "code"] 输出: true 解释: 返回 true 因为 "leetcode" 可以被拆分成 "leet code"。示例 2：输入: s = "applepenapple", wordDict = ["apple", "pen"] 输出: true 解释:...

字符串算法大全【代码】【图】

1、LCSdef lcs(a,b):lena=len(a)lenb=len(b)c=[[0 for i in range(lenb+1)] for j in range(lena+1)]flag=[[0 for i in range(lenb+1)] for j in range(lena+1)]for i in range(lena):for j in range(lenb):if a[i]==b[j]:c[i+1][j+1]=c[i][j]+1flag[i+1][j+1]=‘ok‘elif c[i+1][j]>c[i][j+1]:c[i+1][j+1]=c[i+1][j]flag[i+1][j+1]=‘left‘else:c[i+1][j+1]=c[i][j+1]flag[i+1][j+1]=‘up‘return c,flagdef printLcs(flag,a,i,j...

[PHP] 算法-字符串的左循环的PHP实现【代码】

汇编语言中有一种移位指令叫做循环左移（ROL），现在有个简单的任务，就是用字符串模拟这个指令的运算结果。对于一个给定的字符序列S，请你把其循环左移K位后的序列输出。例如，字符序列S=”abcXYZdef”,要求输出循环左移3位后的结果，即“XYZdefabc”。是不是很简单？OK，搞定它！ 1.字符串翻转,前n位取模长度,abc翻转成cba 后面的翻转成fedXYX ,然后再统一翻转 XYZdefabc 2.第二种思路,字符串复制一份拼接在一起,截取从n开始到le...

算法竞赛入门经典第3章数组和字符串学习笔记 2【代码】

蛇形填数蛇形填数：在n×n方阵里填入1，2，…，n×n，要求填成蛇形。例如，n＝4时方阵为： 10 11 12 1 9 16 13 2 8 15 14 3 7 6 5 4 上面的方阵中，多余的空格只是为了便于观察规律，不必严格输出。n≤8。这个肯定是要用到二维数组的用到了预判，先判断再向上下左右运动会不会越界以及将要运动到的地方是不是已经填了数#include<iostream> #include<cstring> #define maxn 20 using namespace std; int a[maxn][maxn]; int ...

字符串全排列和组合算法【代码】【图】

打印字符串的全排列算法的思路：把一个字符串分成两部分，第一个字符+后面部分所有的字符。这样就能够递归的求解整个过程了：1.每个字符都做一次首字符 2.当某个字符作为首字符的时候，求后面所有字符的全排列而这里的求后面所有字符的全排列可以看成递归的子问题全排列的递归树：但是这里还有一个问题，那就是字符串中有重复的字符时，这样的算法会增加最后的结果数目。比如说字符串aab，a+ab的全排列，然后交换还是a+ab的全排列...

poj 3617 Best Cow Line (字符串反转贪心算法)【代码】【图】

Best Cow LineTime Limit: 1000MS Memory Limit: 65536KTotal Submissions: 9284 Accepted: 2826DescriptionFJ is about to take his N (1 ≤ N ≤ 2,000) cows to the annual"Farmer of the Year" competition. In this contest every farmer arranges his cows in a line and herds them past the judges.The contest organizers adopted a new registration scheme this year: simply register the initial letter of every cow...

代码练习（二维数组的定义，字符串加减，子元素的创建及绑定，排序算法）【代码】

<!DOCTYPE> <html><head><meta charset="utf-8"><title>IFE JavaScript Task 01</title></head> <body><ul id="source"><li>北京空气质量：90</li><li>上海空气质量：70</li><li>天津空气质量：80</li><li>广州空气质量：50</li><li>深圳空气质量：40</li><li>福州空气质量：32</li><li>成都空气质量：90</li></ul><ul id="resort"><!-- <li>第一名：北京空气质量：90</l...

boost字符串算法

boost::algorithm简介2007-12-08 16:59boost::algorithm提供了很多字符串算法，包括：大小写转换；去除无效字符；谓词；查找；删除/替换；切割；连接；我们用写例子的方式来了解boost::algorithm能够为我们做些什么。boost::algorithm学习#include <boost/algorithm/string.hpp>using namespace std;using namespace boost; 一：大小写转换1 to_upper() 将字符串转为大写Example:string str1(" hello world! ");to_upp...

字符串相似度算法，AS3实现，用于判断聊天广告【代码】

/*** 计算把source经过几个步骤可以转变到target的值 * @param source* @param target* @return * */publicstaticfunction editDistance(source:String,target:String):int{var slen:int = source.length;var tlen:int = target.length;var d:Array = [];for(var i:int=0;i<=slen;i++){d[i] = [];d[i][0] = i;if(i==0){for(var j:int=1;j<=tlen;j++){d[0][j] = j;}}else{for(var j:int=1;j<=tlen;j++){d[i][j] = 0;}}}for(var i:in...

ACM经典算法之字符串处理：字符串替换

语法：replace(char str[],char key[],char swap[]); 参数： str[]：在此源字符串进行替换操作 key[]：被替换的字符串，不能为空串 swap[]：替换的字符串，可以为空串，为空串表示在源字符中删除key[] 返回值：null 注意：默认str[]长度小于1000，如否，重新设定设定tmp大小需要 string.h 源程序：#include<stdio.h> #include<string.h>void replace(char str[],char key[],char swap[]) {int l1,l2,l3;int i,j;int flag;char tmp...

Levenshtein距离【编辑距离算法】字符串相似度算法

指两个字串之间，有一个转成另一个所需的最少编辑操作的次数。算法过程str1或str2的长度为0返回另一个字符串的长度。 if(str1.length==0) return str2.length; if(str2.length==0) return str1.length;初始化(n+1)*(m+1)的矩阵d，并让第一行和列的值从0开始增长。扫描两字符串（n*m级的），如果：str1[i] == str2[j]，用temp记录它，为0。否则temp记为1。然后在矩阵d[i,j]赋于d[i-1,j]+1 、d[i,j-1]+1、d[i-1,j-1]+temp三者的最小...

字符串编码解压缩算法【图】

前几天，有一个学C的小伙伴和我交流一个问题，问题他是这么说的：传入一个字符串，格式要求如下：ep: A2D3B4C1D2那么将这个字符串解压的结果应为:AADDDBBBBCDD规则就是，必须满足，字符串的第一个是字母，可以大写也可以小写，第二个为数字，范围为1-9,解压的长度不得超过1000个字符。按照他的要求，我想了一下，实现了这个算法，算法如下:#include <stdio.h> #include <stdlib.h> #include <string.h>int main(void) {//char *str...

JAVA常见算法题(三十三)---求子串在字符串中出现的次数【代码】【图】

计算某字符串中子串出现的次数。publicstaticvoid main(String[] args) {String s1 = "adcdcjncdfbcdcdcd";String s2 = "cd";count(s1, s2);}publicstaticvoid count(String str1, String str2) {int count = 0;if (str1.equals("") || str2.equals("")) {System.out.println("你没有输入字符串或子串，无法比较！");//System.exit(0);} else {for (int i = 0; i <= str1.length() - str2.length(); i++) {if (str2.equals(str1.su...

1、串（字符串）以及串的模式匹配算法【代码】

串（或字符串）是由0个或多个字符组成的有限序列。0个字符的串成为空串。串中任意个连续的字符组成的子序列称为该串的子串。串的表示和实现串有3种机内表示方法：定长顺序存储表示，堆分配存储表示，串的块链存储表示。1、定长顺序存储表示：用一组地址连续的存储单元存储串值的字符序列。//--------串的定长顺序存储表示--------#define MAXSTRLEN 255 //用户可以在255以内定义最大串长 typedef unsigned char SString[MAXST...

python判断字符串是否是数字的算法【图】

判断字符串是否是数字（包含负数和小数）算法1：1、分小数和整数：如果小数点个数为1，则可能是小数。如小数点个数为0，则可能是整数。小数点个数非0也非1，那么就不是数字。2、如果是小数，再分正数和负数的情况：如果首位为负号，则可能是负小数。如果首位不为负号，则可能是正小数。 1）如果首位为负号，则去掉负号。 2）如果首位不为负号；或者是首位为负号，去掉首位负号之后。则判断是否为是否为“.”，如果是，那么就不是...

哈希 - 相关标签

哈希函数哈希加密哈希算法

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / 哈希算法实现字符串匹配

哈希算法实现字符串匹配

内容导读

内容图文

内容总结

内容备注

内容手机端

【哈希算法实现字符串匹配】教程文章相关的互联网学习教程文章

【算法题】字符串单词拆分【代码】

字符串算法大全【代码】【图】

[PHP] 算法-字符串的左循环的PHP实现【代码】

算法竞赛入门经典第3章数组和字符串学习笔记 2【代码】

字符串全排列和组合算法【代码】【图】

poj 3617 Best Cow Line (字符串反转贪心算法)【代码】【图】

代码练习（二维数组的定义，字符串加减，子元素的创建及绑定，排序算法）【代码】

boost字符串算法

字符串相似度算法，AS3实现，用于判断聊天广告【代码】

ACM经典算法之字符串处理：字符串替换

Levenshtein距离【编辑距离算法】字符串相似度算法

字符串编码解压缩算法【图】

JAVA常见算法题(三十三)---求子串在字符串中出现的次数【代码】【图】

1、串（字符串）以及串的模式匹配算法【代码】

python判断字符串是否是数字的算法【图】

字符串 - 相关标签

算法 - 相关标签

哈希 - 相关标签

算法 - 最新教程

算法 - 最热教程