检测文本之间的空间(OpenCV,Python)
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了检测文本之间的空间(OpenCV,Python),小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含3591字,纯文字阅读大概需要6分钟。
内容图文
![检测文本之间的空间(OpenCV,Python)](/upload/InfoBanner/zyjiaocheng/703/027f1773e5464a3da30b0f7987b56878.jpg)
我有以下代码(实际上只是运行我正在处理的所有项目所需的4个部分中的一部分..):
#python classify.py --model models/svm.cpickle --image images/image.png
from __future__ import print_function
from sklearn.externals import joblib
from hog import HOG
import dataset
import argparse
import mahotas
import cv2
ap = argparse.ArgumentParser()
ap.add_argument("-m", "--model", required = True,
help = "path to where the model will be stored")
ap.add_argument("-i", "--image", required = True,
help = "path to the image file")
args = vars(ap.parse_args())
model = joblib.load(args["model"])
hog = HOG(orientations = 18, pixelsPerCell = (10, 10),
cellsPerBlock = (1, 1), transform = True)
image = cv2.imread(args["image"])
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 30, 150)
(_, cnts, _) = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted([(c, cv2.boundingRect(c)[0]) for c in cnts], key =
lambda x: x[1])
for (c, _) in cnts:
(x, y, w, h) = cv2.boundingRect(c)
if w >= 7 and h >= 20:
roi = gray[y:y + h, x:x + w]
thresh = roi.copy()
T = mahotas.thresholding.otsu(roi)
thresh[thresh > T] = 255
thresh = cv2.bitwise_not(thresh)
thresh = dataset.deskew(thresh, 20)
thresh = dataset.center_extent(thresh, (20, 20))
cv2.imshow("thresh", thresh)
hist = hog.describe(thresh)
digit = model.predict([hist])[0]
print("I think that number is: {}".format(digit))
cv2.rectangle(image, (x, y), (x + w, y + h),
(0, 255, 0), 1)
cv2.putText(image, str(digit), (x - 10, y - 10),
cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
cv2.imshow("image", image)
cv2.waitKey(0)
此代码检测并识别图像中的手写数字.这是一个例子:
假设我不关心准确性识别.
我的问题如下:正如您所看到的,程序会获取他可以看到的所有数字并在控制台中打印它们.从控制台我可以将它们保存在文本文件中,如果我想但是我不能告诉程序这些数字之间有空格.
我想要的是,如果我在文本文件中打印数字,它们应该像图像一样分开(对不起,但有点难以解释……).
这些数字不应该(甚至在控制台中)一起打印,但是,如果有空白,也会打印出一个空白区域.
看看第一张图片.在前10位数之后,图像中有一个空白区域,而控制台中没有空白区域.
无论如何,这里是完整代码的链接.有4个.py文件和3个文件夹.要执行,请在文件夹中打开CMD并粘贴命令python classify.py –model models / svm.cpickle –image images / image.png其中image.png是images文件夹中一个文件的名称.
提前致谢.在我看来,所有这些工作都必须使用神经网络完成,但我想先用这种方式尝试.我对此很陌生.
解决方法:
这是一个入门解决方案.
我暂时没有Python中的任何东西,但转换它并不难,加上OpenCV函数调用是类似的,我在下面链接它们.
TLDR;
找到boundingRects的中心,然后找到它们之间的距离.如果一个矩形距离某个阈值,您可以将其视为一个空格.
首先,找到边界矩形的中心
vector<Point2f> centres;
for(size_t index = 0; index < contours.size(); ++index)
{
Moments moment = moments(contours[index]);
centres.push_back(Point2f(static_cast<float>(moment.m10/moment.m00), static_cast<float>(moment.m01/moment.m00)));
}
(可选但建议)
您可以绘制中心以对其进行直观了解.
for(size_t index = 0; index < centres.size(); ++index)
{
Scalar colour = Scalar(255, 255, 0);
circle(frame, circles[index], 2, colour, 2);
}
通过它,只需遍历它们,确认到下一个的距离在合理的阈值内
for(size_t index = 0; index < centres.size(); ++index)
{
// this is just a sample value. Tweak it around to see which value actually makes sense
double distance = 0.5;
Point2f current = centres[index];
Point2f nextPoint = centres[index + 1];
// norm calculates the euclidean distance between two points
if(norm(nextPoint - current) >= distance)
{
// TODO: This is a potential space??
}
}
您可以在Python中阅读有关moments,norm和circle drawing调用的更多信息.
快乐的编码,
队友的欢呼声 :)
内容总结
以上是互联网集市为您收集整理的检测文本之间的空间(OpenCV,Python)全部内容,希望文章能够帮你解决检测文本之间的空间(OpenCV,Python)所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。