AI视频数字识别、分割（上）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了AI视频数字识别、分割（上），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5138字，纯文字阅读大概需要8分钟。

内容图文

任务描述:

根据视频中的数字的变化切割视频（国网需求）；

夜晚热红外视频帧：

AI视频数字识别、分割（上） - 文章图片

根据右上角机位数字分割视频

AI视频数字识别、分割（上） - 文章图片

思路:

视频分帧
aoi区域裁剪
字符分割
神经网络模型训练
字符识别
断点确定
分割视频

一、视频分帧

# Step1:视频读取、分帧
# 1.保存视频每一秒的图面
def save_image(image, addr, num):
    address = addr + str(num) + '.jpg'
    cv2.imencode('.jpg', image)[1].tofile(address)
    # cv2.imwrite(address, image)


# 2.视频分帧
def video_clip(src_path, save_path):
    # 读取视频
    video_capture = cv2.VideoCapture(src_path)
    # 读帧
    success, frame = video_capture.read()
    # 设置固定帧率（查看视频属性）
    timeF = 25
    i = 0
    j = 0
    while success:
        i = i + 1
        if (i % timeF == 0):
            j = j + 1
            save_image(frame, save_path, j)
        success, frame = video_capture.read()
    print("================视频分帧完成！===================")

输出：

AI视频数字识别、分割（上） - 文章图片

二、aoi区域裁剪

# Step2:AOI切割
# 1.选择裁剪区域
def select_point(frame_path):
    frame_img = Image.open(frame_path + '1.jpg')
    plt.imshow(frame_img, cmap=plt.get_cmap("gray"))
    aoi_points = plt.ginput(4)     # 选4个点（左上，右上，左下，右下）
    return aoi_points


# 2.获取四至坐标
def get_bound(aoi_pts):
    x_arr = []
    y_arr = []
    for pt in aoi_pts:
        x_arr.append(int(pt[0]))
        y_arr.append(int(pt[1]))
    return min(x_arr), max(x_arr), min(y_arr), max(y_arr)


# 3.批量裁剪
def clip_frame_img(frame_path, aoi_path):
    # 获取裁剪范围
    aoi_pts = select_point(frame_path)
    x_min, x_max, y_min, y_max = get_bound(aoi_pts)
    # 裁剪
    frame_name = os.listdir(frame_path)
    print("正在进行aoi区域裁剪，请稍候...")
    for frame in frame_name:
        frame_full_path = os.path.join(frame_path, frame)
        frame_image = cv2.imdecode(np.fromfile(frame_full_path, dtype=np.uint8), -1)
        aoi_image = frame_image[y_min:y_max, x_min:x_max]
        cv2.imencode('.jpg', aoi_image)[1].tofile(aoi_path + frame)
    print("================aoi区域裁剪完成！===================")
   

 # 没跳出裁剪窗口？
 # pycharm设置问题，修改下配置：
 # windows系统：Settings | Tools | Python Scientific | Show Plots in Toolwindow，去掉对勾
 # MAC系统：Preferences | Tools | Python Scientific | Show Plots in Toolwindow，去掉对勾

输出：

AI视频数字识别、分割（上） - 文章图片

三、字符分割

参照：https://www.cnblogs.com/zxy-joy/p/10687152.html

# Step3:字符分割
# 水平投影
def horizon_prj(image):
    h_prj = np.zeros(image.shape, np.uint8)
    # 图像高与宽
    (h, w) = image.shape
    # 长度与图像高度一致的数组
    h_ = [0] * h
    # 循环统计每一行黑色像素的个数（image[y, x] == 255是白色）
    for y in range(h):
        for x in range(w):
            if image[y, x] == 0:
                h_[y] += 1
    # 绘制水平投影图像
    for y in range(h):
        for x in range(h_[y]):
            h_prj[y, x] = 0
    return h_


# 垂直投影
def vetical_project(image):
    v_prj = np.zeros(image.shape, np.uint8)   # 创建空白图片
    (h, w) = image.shape
    # 长度与图像宽度一致的数组
    w_ = [0] * w
    # 循环统计每一列白色像素的个数
    for x in range(w):
        for y in range(h):
            if image[y, x] == 0:
                w_[x] += 1
    # 绘制垂直平投影图像
    for x in range(w):
        for y in range(h - w_[x], h):
            v_prj[y, x] = 0
    return w_


# aoi投影
def aoi_prj(aoi_image):
    aoi_b2_image = cv2.cvtColor(aoi_image, cv2.COLOR_BGR2GRAY)
    retval, img = cv2.threshold(aoi_b2_image, 127, 255, cv2.THRESH_BINARY_INV)
    h, w = img.shape
    position = []
    # 水平投影
    H = horizon_prj(img)
    h_start = 0
    H_Start = []
    H_End = []
    for i in range(len(H)):
        if H[i] > 0 and h_start == 0:
            H_Start.append(i)
            h_start = 1
        if H[i] <= 0 and h_start == 1:
            H_End.append(i)
            h_start = 0
    if len(H_End) == 0:
        H_End.append(h)
    # 分割行，分割之后再进行列分割并保存分割位置
    for i in range(len(H_Start)):
        # 获取行图像
        crop_img = img[H_Start[i]:H_End[i], 0:w]
        # 对行图像进行垂直投影
        W = vetical_project(crop_img)
        w_start = 0
        w_end = 0
        W_Start = 0
        W_End = 0
        for j in range(len(W)):
            if W[j] > 0 and w_start == 0:
                W_Start = j
                w_start = 1
                w_end = 0
            if W[j] <= 0 and w_start == 1:
                W_End = j
                w_start = 0
                w_end = 1
            if w_end == 1:
                position.append([W_Start, H_Start[i], W_End, H_End[i]])
                w_end = 0
    # 根据确定的位置分割字符
    # for m in range(len(position)):
    #     cv2.rectangle(aoi_image, (position[m][0], position[m][1]), (position[m][2], position[m][3]),
    #                   (0, 229, 238),
    #                   1)
    return position


# 字符分割（个人逻辑，仅供参考）
# 分割难免有误，或多或少
# 根据视频的连续性，多的去之，少的替之（以前后帧相替）
def character_split(aoi_path, character_path):
    aoi_name = os.listdir(aoi_path)
    all_aoi_positions = []
    for aoi in aoi_name:
        aoi_full_path = os.path.join(aoi_path, aoi)
        aoi_image = cv2.imdecode(np.fromfile(aoi_full_path, dtype=np.uint8), -1)
        aoi_positions = aoi_prj(aoi_image)
        i = 0
        if len(aoi_positions) == 7:
            all_aoi_positions.append(aoi_positions)
        elif len(aoi_positions) == 8:
            del (aoi_positions[0])
        else:
            if i == 0:
                print("第一个就有问题！")
            else:
                aoi_positions = all_aoi_positions[i - 1]
        l = 0
        for aoi_position in aoi_positions:
            crop_image = aoi_image[aoi_position[1]:aoi_position[3], aoi_position[0]:aoi_position[2]]
            crop_2image = np.where(crop_image[..., :] < 127, 0, 255)
            row_crop_2image = crop_2image[1, :]
            row_mean = row_crop_2image.mean(axis=1).tolist()
            if row_mean.count(255.0) > len(row_mean) * 2 / 3:
                crop_2image = np.where(crop_2image[..., :] == 0, 255, 0)
            # print(row_mean.count(255.0))
            # cv2.imencode('.jpg', crop_2image)[1].tofile(character_path + aoi.split('.')[0] + '_' + str(i) + '.jpg')
            if l != 4:
                cv2.imencode('.jpg', crop_2image)[1].tofile(
                    character_path + aoi.split('.')[0] + '_' + str(l) + '.jpg')
            l += 1
        i = i + 1
    print("================字符分割完成！===================")

输出：

AI视频数字识别、分割（上） - 文章图片

内容有点多，其他的放下一波吧~

内容总结

以上是互联网集市为您收集整理的AI视频数字识别、分割（上）全部内容，希望文章能够帮你解决AI视频数字识别、分割（上）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1042580.html

来源：【匿名】

【上一篇】PMP学习笔记第零章：启动【下一篇】关于IE的RegExp.exec的问题

更多 ►

【AI视频数字识别、分割（上）】教程文章相关的互联网学习教程文章

发现引流新功能！还是免费的！视频号引流到公众号，提交自己公众号文章链接，可以生成自己公众号的关注页的文章链接再将生成的文章链接放入视频号的扩展链接中，当用户点击视频下方的扩展链接时，会进入自己公众号的关注页面，实现了将视频号流量引入公众号话不多说直接开始教学：第一步：浏览器地址栏输入 uom.cn/v 进入官网：操作方法二? 第二步：放入自己公众号的任意一篇公众号文章，点击提交，就会生成关注自己公众号...

摩杜云电商视频直播解决方案：直播3.0时代，视频云是必不可少的新基础设施【图】

随着云计算的技术飞速发展，视频云的应用范围也逐渐深入到各行各业当中，根据IDC发布的《中国视频云市场跟踪(2020上半年)》报告显示，2020上半年中国视频云市场规模达到31.6亿美元，同比增长58.6%，其中视频云解决方案市场最为亮眼，同比增长超过70%。视频云服务***生活方方面面去年是一个特殊的年份，严格的社交限制，5G时代的到来，为视频行业带来了更大的想象空间。以视频为媒介，人们不仅可以获取资讯，进行娱乐和学习，更是促...

webrtc实现视频群聊系列文章终章之完成即时通讯+多人视频会议（开放源码）【代码】【图】

引言前面几篇文章讲了使用webrtc实现本地模拟通话视频聊天，现实网络1对1视频聊天以及屏幕分享和聊天随时切换的文章，接下来就下来实战怎么利用webrtc实现多人群视频通话，会议webrtc实现群聊系列文章(一)本地模拟视频通话 webrtc实现视频群聊系列文章(二)实现网络中一对一视频聊天 webrtc打造群视频聊天系列之视频聊天和屏幕分享随意切换思路因为webrtc是点对点的，通过前面文章我们也实现了相应的效果，但是多对多的实现思路也是...

日常篇 - 数据库视频总结博客

占位博客，后续补数据库视频有理论有实践，是我们了解数据库重要的一步，通过看数据库视频，了解了数据库的基本操作以及数据库的功能：数据库视频主要从数据库的环境-数据库开发环境的安装-数据的开发环境的讲解-数据库的创建-数据库开发环境的基本创建，将的很详细，但是要多多亲手操作才能记得更多，点赞收藏分享文章举报王文诏-Martin发布了17 篇原创文章 · 获赞 3 · 访问量 3602私信关注

视频 | 阿里文娱智能营销增益模型（uplift model）技术实践【图】

Tech-Ku & DataFunLive 情人节专场直播：2月14日(周五)晚19点，DataFun联合阿里文娱技术举办情人节专场直播，邀请来自阿里文娱的算法专家奕晴，为大家分享了 "阿里文娱智能营销增益模型 ( uplift model ) 技术实践"。本次直播分享了营销增益模型的原理和常见的建模及评估方法，并以淘票票智能票补为例介绍uplift model技术的实践经验。注：PPT下载，请关注DataFunTalk公众号，后台回复“20200214”，即可下载。01活动信息主题：阿里...

如何使用Camtasia和YouTube为视频添加字幕？【图】

在制作视频时，需要为它们加上字幕，让我们尝试一种简单的方法，使用Camtasia和YouTube为视频加上字幕。1.在Camtasia中创建视频。提示：说话时，放慢语速，使用基于USB的麦克风。如果没有，使用可用的工具。微笑。当您在录制时微笑时，它会使您的声音变亮，并持续到录制中。2.将视频从Camtasia导出到计算机上的某个位置。3.上传到YouTube。登录到您的YouTube帐户。点击“创建”图标，然后选择上传视频。请按照以下步骤上传视频，分...

视频编辑SDK测试【图】

在其他小伙伴的公众号里发现了这篇，copy过来~ 持续性颓废，间歇性努力的日子又开始了。短视频编辑SDK测试有一段时间了，因此抽时间对编辑SDK的相关内容进行简要复盘。功能说明短视频编辑SDK支持gif，不同格式的图片，视频文件的拼接导入，编辑，添加特效，合成导出等功能。更具体的介绍可以参照官网的SDK开发文档。https://live.360.cn/developer/doc？page_id=67&item_id=5 模块结构编辑SDK的核心模块包括时间线、特效指令、...

小程序短视频项目———开发用户信息之用户上传头像【代码】

一、后端用户头像上传接口开发新建UsersController，用来开发与用户相关的业务package com.imooc.controller;import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.util.UUID;import org.apache.commons.lang3.StringUtils; import org.apache.tomcat.util.http.fileupload.IOUtils; import org.springframework.beans.BeanUtils; import org.springframework.beans.factory.annotati...

一分钟教你如何轻松提取任何视频音频【图】

寻找了好久的视频音频提取工具，4K YouTube to MP3 for Mac终于被我找到，包括MP3，MP4，AVI，FLV，3GP，MKV的输出，界面干净，整洁，只需要把喜欢的内容从浏览器复制粘贴到URL按钮，您就可以等着4K YouTube to MP3 为您服务了，提取出来观看就可以啦。下面我们来看看使用4K YouTube to MP3 for Mac如何将YouTube转换为MP3？1. 点击上方链接下载并安装4K YouTube到MP3应用程序。它适用于macOS，Windows和Linux。2. 从浏览器复制视频...

【Azure 媒体服务】使用媒体服务 v3 对视频进行上载、编码和流式传输时遇见的AAD错误【代码】

问题描述使用媒体服务 v3 对视频进行上载、编码和流式传输示例时，遇见了AAD错误。TIP: Make sure that you have filled out the appsettings.json file before running this sample.AADSTS90002: Tenant xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx not found. This may happen if there are no active subscriptions for the tenant. Check to make sure you have the correct tenant ID. Check with your subscription administrato...

微信小程序调用video视频播放没有声音的原因【图】

微信小程序Video组件的声音是由muted控制，一般会写成 muted = "flase" ，或者直接muted，默认值不起作用，只能写成muted="{{flase}}"

将多个blv格式的视频合并为一个mp4格式视频【代码】【图】

将B站缓存的视频从手机导出时，发现有一部分视频被拆分成了很多个blv格式的小视频，于是想将其合并转为mp4格式的视频。一、配置FFmpeg环境参考： https://www.cnblogs.com/cyx-b/p/13897210.html 二、批量修改格式需要将所有blv文件重命名为flv 可以用批处理完成，方法如下：在当前目录，新建一个文本文档，然后写入ren *.blv *.flv，保存后将后缀名由.txt改为.bat。双击这个批处理文件，转换完成。三、将需要合并的文件名写入...

小程序使用腾讯视频【代码】

视频 app.json "plugins": {"tencentvideo": {"version": "1.3.6","provider": "wxa75efa648b60994b"} }, index.json {"usingComponents": {"txv-video": "plugin://tencentvideo/video"} } index.wxml<txv-video vid="{{index_data.video_info.url}}" playerid="{{index_data.video_info.url}}" autoplay="{{false}}"></txv-video>

腾讯会议视频没声音【图】

最近很多小伙伴在家办公或者学习，下载了腾讯会议这款好用的软件，但是在使用的时候，难免会出现一些小问题，比如开会视频的时候，没有声音是怎么一回事呢？今天小编带来了详细的解决方法，具体的一起来看看吧。【腾讯会议常见问题汇总】腾讯会议视频没声音解决方法1、先确保麦克风硬件没有问题，可使用其他语音通话试验一下，然后进入腾讯会议。2、发起会议用户在发起时要选择电脑音频接入。3、如果没有接入电脑音频，进入直播后点...

吉柚小视频APP现成源码

吉柚小视频APP现成源码，吉柚小视频软件开发找梁经理（153微2202电6891），吉柚小视频定制开发，吉柚小视频现在开发，吉柚小视频系统开发。在互联网经济时代，经济主体的生产、交换、分配、消费等经济活动，以及金融机构和政府职能部门等主体的经济行为，都越来越多地依赖信息网络，不仅要从网络上获取大量经济信息，依靠网络进行预测和决策，而且许多交易行为也直接在信息网络上进行。 [如何玩转吉柚小视频?] (玩法一)0撸注册账...

首页 / 更多教程 / AI视频数字识别、分割（上）

AI视频数字识别、分割（上）

内容导读

内容图文

任务描述:

根据视频中的数字的变化切割视频（国网需求）；

夜晚热红外视频帧：

根据右上角机位数字分割视频

思路:

一、视频分帧

输出：

二、aoi区域裁剪

输出：

三、字符分割

输出：

内容有点多，其他的放下一波吧~

内容总结

内容备注

内容手机端

【AI视频数字识别、分割（上）】教程文章相关的互联网学习教程文章

视频号如何实现公众号一键关注？（已解决）【图】

摩杜云电商视频直播解决方案：直播3.0时代，视频云是必不可少的新基础设施【图】

webrtc实现视频群聊系列文章终章之完成即时通讯+多人视频会议（开放源码）【代码】【图】

日常篇 - 数据库视频总结博客

视频 | 阿里文娱智能营销增益模型（uplift model）技术实践【图】

如何使用Camtasia和YouTube为视频添加字幕？【图】

视频编辑SDK测试【图】

小程序短视频项目———开发用户信息之用户上传头像【代码】

一分钟教你如何轻松提取任何视频音频【图】

【Azure 媒体服务】使用媒体服务 v3 对视频进行上载、编码和流式传输时遇见的AAD错误【代码】

微信小程序调用video视频播放没有声音的原因【图】

将多个blv格式的视频合并为一个mp4格式视频【代码】【图】

小程序使用腾讯视频【代码】

腾讯会议视频没声音【图】

吉柚小视频APP现成源码

更多教程 - 最新教程

更多教程 - 最热教程