首页 / PYTHON / 检测文本之间的空间(OpenCV,Python)

检测文本之间的空间(OpenCV,Python)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了检测文本之间的空间(OpenCV,Python)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3591字，纯文字阅读大概需要6分钟。

内容图文

我有以下代码(实际上只是运行我正在处理的所有项目所需的4个部分中的一部分..)：

#python classify.py --model models/svm.cpickle --image images/image.png

from __future__ import print_function
from sklearn.externals import joblib
from hog import HOG
import dataset
import argparse
import mahotas
import cv2

ap = argparse.ArgumentParser()
ap.add_argument("-m", "--model", required = True,
    help = "path to where the model will be stored")
ap.add_argument("-i", "--image", required = True,
    help = "path to the image file")
args = vars(ap.parse_args())

model = joblib.load(args["model"])

hog = HOG(orientations = 18, pixelsPerCell = (10, 10),
    cellsPerBlock = (1, 1), transform = True)

image = cv2.imread(args["image"])
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 30, 150)
(_, cnts, _) = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

cnts = sorted([(c, cv2.boundingRect(c)[0]) for c in cnts], key =
    lambda x: x[1])

for (c, _) in cnts:
    (x, y, w, h) = cv2.boundingRect(c)

    if w >= 7 and h >= 20:
        roi = gray[y:y + h, x:x + w]
        thresh = roi.copy()
        T = mahotas.thresholding.otsu(roi)
        thresh[thresh > T] = 255
        thresh = cv2.bitwise_not(thresh)

        thresh = dataset.deskew(thresh, 20)
        thresh = dataset.center_extent(thresh, (20, 20))

        cv2.imshow("thresh", thresh)

        hist = hog.describe(thresh)
        digit = model.predict([hist])[0]
        print("I think that number is: {}".format(digit))

        cv2.rectangle(image, (x, y), (x + w, y + h),
        (0, 255, 0), 1)
        cv2.putText(image, str(digit), (x - 10, y - 10),
        cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
        cv2.imshow("image", image)
        cv2.waitKey(0)

此代码检测并识别图像中的手写数字.这是一个例子：

假设我不关心准确性识别.

我的问题如下：正如您所看到的,程序会获取他可以看到的所有数字并在控制台中打印它们.从控制台我可以将它们保存在文本文件中,如果我想但是我不能告诉程序这些数字之间有空格.

我想要的是,如果我在文本文件中打印数字,它们应该像图像一样分开(对不起,但有点难以解释……).
这些数字不应该(甚至在控制台中)一起打印,但是,如果有空白,也会打印出一个空白区域.

看看第一张图片.在前10位数之后,图像中有一个空白区域,而控制台中没有空白区域.

无论如何,这里是完整代码的链接.有4个.py文件和3个文件夹.要执行,请在文件夹中打开CMD并粘贴命令python classify.py –model models / svm.cpickle –image images / image.png其中image.png是images文件夹中一个文件的名称.

Full Code

提前致谢.在我看来,所有这些工作都必须使用神经网络完成,但我想先用这种方式尝试.我对此很陌生.

解决方法:

这是一个入门解决方案.

我暂时没有Python中的任何东西,但转换它并不难,加上OpenCV函数调用是类似的,我在下面链接它们.

TLDR;

找到boundingRects的中心,然后找到它们之间的距离.如果一个矩形距离某个阈值,您可以将其视为一个空格.

首先,找到边界矩形的中心

vector<Point2f> centres;

for(size_t index = 0; index < contours.size(); ++index)
{
    Moments moment = moments(contours[index]);

    centres.push_back(Point2f(static_cast<float>(moment.m10/moment.m00), static_cast<float>(moment.m01/moment.m00)));
}

(可选但建议)

您可以绘制中心以对其进行直观了解.

for(size_t index = 0; index < centres.size(); ++index)
{
    Scalar colour = Scalar(255, 255, 0);
    circle(frame, circles[index], 2, colour, 2);
}

通过它,只需遍历它们,确认到下一个的距离在合理的阈值内

for(size_t index = 0; index < centres.size(); ++index)
{
    // this is just a sample value. Tweak it around to see which value actually makes sense
    double distance = 0.5;
    Point2f current = centres[index];
    Point2f nextPoint = centres[index + 1];

    // norm calculates the euclidean distance between two points
    if(norm(nextPoint - current) >= distance)
    {
        // TODO: This is a potential space??
    }
}

您可以在Python中阅读有关moments,norm和circle drawing调用的更多信息.

快乐的编码,
队友的欢呼声：)

内容总结

以上是互联网集市为您收集整理的检测文本之间的空间(OpenCV,Python)全部内容，希望文章能够帮你解决检测文本之间的空间(OpenCV,Python)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/702961.html

来源：【匿名】

【上一篇】python – 熊猫数据帧评估中的动态列名【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【检测文本之间的空间(OpenCV,Python)】教程文章相关的互联网学习教程文章

Python + Opencv2 实现轮廓提取，轮廓区域面积计算【代码】【图】

对图像处理时，会遇到这样一个场景：找到图像主体轮廓，这是其一，可能为了凸显轮廓，需要用指定的颜色进行标记；轮廓标记完可能任务还没有结束，还需对轮廓所勾勒的像素面积区域统计计算。本篇文章的主要内容就是要解决上面场景遇到的三个问问题找到图像主题轮廓；用指定颜色对源图像进行轮廓标记；计算轮廓中的主体;实验环境配置为 Python + Opencv 3.4，处理的图像如下：第一步，提取轮廓，Opencv 中的 findContours() 函数可...

inux deploy安装Python的OpenCV踩到的坑以及我的解决方法【图】

前言无意间看到一篇Python+OpenCV连接ip摄像头的文章,刚好手上有部装了linux deploy的手机,就想试试,结果遇到各种坑…本篇文章主要目的是记录自己踩到的坑,以及给遇到同样问题的朋友提供一点参考顺带吐槽一下,我的另一台手机直接pip就用,真是哔了狗了…准备工作linux deploy的安装参考其他朋友的帖子,这里不多做赘述文中的编译并不是直接使用cmake手动编译,而是通过pip自动编译,也就是说直接使用pip install后会自动执行编译任务手...

Mac下python3安装opencv【代码】

pypi里opencv给的命令是pip install opencv-python但是这样会安到python 2.7再过一个多月python 2.7和pip就要drop了你在逗我？？然而使用pip3 install opencv-python会报错看了好多教程，乱七八糟的，还得各种改其实特别简单！！！特别简单！！！这个命令前面加个sudosudo pip3 install opencv-python 收工原文：https://www.cnblogs.com/aethria/p/11854178.html

Python-OpenCV学习（一）：OpenCV结构【图】

转载请注明出处：danscarlett的博客园 OpenCV是计算机视觉领域应用最广泛的开源工具包，基于C/C++，支持Linux/Windows/MacOS/Android/iOS，并提供了Python，Matlab和Java等语言的接口。2010年OpenCV发布了2.0版本，添加了非常完备的C++接口，从2.0开始的版本非常用户非常庞大，至今仍在维护和更新。2015年OpenCV 3正式发布，除了架构的调整，还加入了更多算法，更多性能的优化和更加简洁的API，另外也加强了对GPU的支持，现在已经...

python_opencv修改视频分辨率【代码】

在测试alphapose时，原始视频的分辨率过高，导致网络难以运行，所以要修改视频的分辨率，代码如下：import cv2 cap = cv2.VideoCapture("videl_1.mp4") videowriter = cv2.VideoWriter("videl_640_360"+".avi", cv2.VideoWriter_fourcc(‘M‘, ‘J‘, ‘P‘, ‘G‘), 15, (640,360))success, _ = cap.read()while success:success, img1 = cap.read()try:img = cv2.resize(img1, (640, 360), interpolation=cv2.INTER_LINEAR)video...

OpenCV-Python基础教程5-阈值分割与Otsu阈值法【代码】【图】

一、固定阈值分割import cv2 import matplotlib.pyplot as plt# 灰度图读入 img = cv2.imread(‘gradient.jpg‘, 0)# 阈值分割 ret, th = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)cv2.imshow(‘thresh‘, th) cv2.waitKey(0)cv2.threshold()用来实现阈值分割，有4个参数：参数1：要处理的原图，一般是灰度图参数2：设定的阈值参数3：最大阈值，一般是255参数4：阈值的方式，主要有5种，详情：ThresholdTypes理解这5种阈值...

Python-OpenCV——Morphological Transformations(形态学转换)【代码】【图】

目标这一节我们将学习不同的形态学操作，如腐蚀、膨胀、开、闭......我们将看到不同的函数，如：cv2.erode()、cv2.dilate()、cv2.morphology()理论形态变换是基于图像形状的一些简单操作。它通常在二进制图像上执行。它需要两个输入，一个是我们的原始图像，第二个是称为结构元素或内核，它决定了操作的本质。两个基本的形态学运算符是侵蚀和膨胀。然后它的变体形式如Opening，Closing，Gradient等也发挥作用。我们将在以下图...

opencv-python用原图和mask实现抠图【代码】【图】

1、先上图原图：test1.pngmask图：test-mask.png结果图：mask.png 2、代码部分import cv2 from PIL import Image import numpy as npyuantu = "test1.png" masktu = "test1-mask.png"#使用opencv叠加图片 img1 = cv2.imread(yuantu) img2 = cv2.imread(masktu)alpha = 0.5 meta = 1 - alpha gamma = 0 #cv2.imshow(‘img1‘, img1) #cv2.imshow(‘img2‘, img2) #image = cv2.addWeighted(img1,alpha,img2,meta,gamma) image = cv2...

python opencv3 静态图片检测人脸【代码】

git：https://github.com/linyi0604/Computer-Vision 1# coding:utf-8 2 3import cv24 5 filename = "../data/mm3.jpg" 6 7 8def detect(filename):9# 创建检测人脸的对象要在opencv的目录下找到xml文件，放置到自己项目中10 face_cascade = cv2.CascadeClassifier("../data/haarcascade_frontalface_default.xml") 11# 读取图像12 img = cv2.imread(filename) 13# 转为灰度图像14 gray = cv2.cvtColor(img, cv2.COLO...

基于python3+opencv3图像基础IO操作【代码】【图】

环境Anaconda+python3.5.2+opencv31.先测试一下numpy的矩阵。import numpy as np import cv2img=np.zeros((3,3),dtype=np.uint8) print(img.shape) img=cv2.cvtColor(img,cv2.COLOR_GRAY2BGR) print(‘\n‘) print(img.shape) print(‘\n‘) print(img) 2.import cv2grayImage=cv2.imread(‘/home/cisco/Pictures/Webcam/ss.jpg‘,0) cv2.imwrite(‘ssgray.jpg‘,grayImage)AnyColor=cv2.imread(‘/home/cisco/Pictures/Webcam/...

Python+OpenCV图像处理之开闭操作【代码】【图】

开操作：图像形态学的重要操纵之一，基于膨胀与腐蚀操作组合形成的；主要是应用在二值图像分析中，灰度图像亦可开操作 = 腐蚀+膨胀，输入图像 + 结构元素作用：用来消除小物体、平滑较大物体的边界的同时并不明显改变其面积，提取水平或竖直的线闭操作：图像形态学的重要操纵之一，基于膨胀与腐蚀操作组合形成的；主要是应用在二值图像分析中，灰度图像亦可闭操作 = 膨胀+腐蚀，输入图像 + 结构元素作用：用来填充物体内细小空洞...

【python下使用OpenCV实现计算机视觉读书笔记2】图像与字节的变换【代码】【图】

import cv2 import numpy import os # Make an array of 120,000 random bytes. randomByteArray = bytearray(os.urandom(120000))flatNumpyArray = numpy.array(randomByteArray) # Convert the array to make a 400x300 grayscale image. grayImage = flatNumpyArray.reshape(300, 400) cv2.imwrite(‘RandomGray.png‘, grayImage) # Convert the array to make a 400x100 color image. bgrImage = flatNumpyArray.reshape(100,...

Python OpenCV —— bitwise【代码】【图】

关于图像的位操作，目的是为了将一个logo覆盖到另一个图片上。# -*- coding: utf-8 -*- """ Created on Wed Sep 28 20:05:50 2016@author: Administrator """‘‘‘ 位运算 Bitwise Operations ‘‘‘ import numpy as np import cv2def show(img_name,img_data):cv2.imshow(img_name,img_data)cv2.waitKey(0)cv2.destroyAllWindows()# Load two images img1 = cv2.imread(‘ml.png‘) img2 = cv2.imread(‘opencv_logo.png‘)# I ...

【AI】python：opencv【代码】

2018-03-02 好的开始就意味着成功了一半。pip install opencv-python Collecting opencv-pythonDownloading opencv_python-3.4.0.12-cp36-cp36m-win_amd64.whl (33.3MB)100% |████████████████████████████████| 33.4MB 551kB/s Requirement already satisfied: numpy>=1.11.3 in c:\users\xxx\anaconda3\lib\site-packages (from opencv-python) Installing collected packages: opencv-pytho...

OpenCV-Python 理解SVM | 五十五【图】

目标在这一章中我们将对SVM有一个直观的了解理论线性可分数据考虑下面的图像，它具有两种数据类型，红色和蓝色。在kNN中，对于测试数据，我们用来测量其与所有训练样本的距离，并以最小的距离作为样本。测量所有距离都需要花费大量时间，并且需要大量内存来存储所有训练样本。但是考虑到图像中给出的数据，我们是否需要那么多？考虑另一个想法。我们找到一条线\(f(x)=ax_1 + bx_2+c\)，它将两条数据都分为两个区域。当我们得到一个...

首页 / PYTHON / 检测文本之间的空间(OpenCV,Python)

检测文本之间的空间(OpenCV,Python)

内容导读

内容图文

内容总结

内容备注

内容手机端

【检测文本之间的空间(OpenCV,Python)】教程文章相关的互联网学习教程文章

Python + Opencv2 实现轮廓提取，轮廓区域面积计算【代码】【图】

inux deploy安装Python的OpenCV踩到的坑以及我的解决方法【图】

Mac下python3安装opencv【代码】

Python-OpenCV学习（一）：OpenCV结构【图】

python_opencv修改视频分辨率【代码】

OpenCV-Python基础教程5-阈值分割与Otsu阈值法【代码】【图】

Python-OpenCV——Morphological Transformations(形态学转换)【代码】【图】

opencv-python用原图和mask实现抠图【代码】【图】

python opencv3 静态图片检测人脸【代码】

基于python3+opencv3图像基础IO操作【代码】【图】

Python+OpenCV图像处理之开闭操作【代码】【图】

【python下使用OpenCV实现计算机视觉读书笔记2】图像与字节的变换【代码】【图】

Python OpenCV —— bitwise【代码】【图】

【AI】python：opencv【代码】

OpenCV-Python 理解SVM | 五十五【图】

PYTHON - 相关标签

OPENCV - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程