首页 / PYTHON / 在python中的单词上拆分语音音频文件

在python中的单词上拆分语音音频文件

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了在python中的单词上拆分语音音频文件，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2341字，纯文字阅读大概需要4分钟。

内容图文

我觉得这是一个相当普遍的问题,但我还没有找到合适的答案.我有许多人类语音的音频文件,我想在单词上打破,这可以通过查看波形中的暂停来启发式地完成,但是有人能指向我自动执行此操作的python中的函数/库吗？

解决方法:

更简单的方法是使用pydub模块.最近的silent utilities增加了所有的重任,如设置沉默threahold,设置沉默长度.与提到的其他方法相比,显着简化了代码.

这是一个演示实现,灵感来自here

设定：

我在“a-z.wav”文件中有一个带有A到Z英语口语的音频文件.在当前工作目录中创建了子目录splitAudio.在执行演示代码时,文件被分成26个单独的文件,每个音频文件存储每个音节.

观察：
一些音节被切断,可能需要修改以下参数,
min_silence_len = 500
silence_thresh = -16

人们可能想要根据自己的要求调整这些.

演示代码：

from pydub import AudioSegment
from pydub.silence import split_on_silence

sound_file = AudioSegment.from_wav("a-z.wav")
audio_chunks = split_on_silence(sound_file, 
    # must be silent for at least half a second
    min_silence_len=500,

    # consider it silent if quieter than -16 dBFS
    silence_thresh=-16
)

for i, chunk in enumerate(audio_chunks):

    out_file = ".//splitAudio//chunk{0}.wav".format(i)
    print "exporting", out_file
    chunk.export(out_file, format="wav")

输出：

Python 2.7.9 (default, Dec 10 2014, 12:24:55) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> ================================ RESTART ================================
>>> 
exporting .//splitAudio//chunk0.wav
exporting .//splitAudio//chunk1.wav
exporting .//splitAudio//chunk2.wav
exporting .//splitAudio//chunk3.wav
exporting .//splitAudio//chunk4.wav
exporting .//splitAudio//chunk5.wav
exporting .//splitAudio//chunk6.wav
exporting .//splitAudio//chunk7.wav
exporting .//splitAudio//chunk8.wav
exporting .//splitAudio//chunk9.wav
exporting .//splitAudio//chunk10.wav
exporting .//splitAudio//chunk11.wav
exporting .//splitAudio//chunk12.wav
exporting .//splitAudio//chunk13.wav
exporting .//splitAudio//chunk14.wav
exporting .//splitAudio//chunk15.wav
exporting .//splitAudio//chunk16.wav
exporting .//splitAudio//chunk17.wav
exporting .//splitAudio//chunk18.wav
exporting .//splitAudio//chunk19.wav
exporting .//splitAudio//chunk20.wav
exporting .//splitAudio//chunk21.wav
exporting .//splitAudio//chunk22.wav
exporting .//splitAudio//chunk23.wav
exporting .//splitAudio//chunk24.wav
exporting .//splitAudio//chunk25.wav
exporting .//splitAudio//chunk26.wav
>>>

内容总结

以上是互联网集市为您收集整理的在python中的单词上拆分语音音频文件全部内容，希望文章能够帮你解决在python中的单词上拆分语音音频文件所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/705302.html

来源：【匿名】

【上一篇】python – 找出一个函数是否被调用【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【在python中的单词上拆分语音音频文件】教程文章相关的互联网学习教程文章

< python音频库：Windows下pydub安装配置、过程出现的问题及常用API >【代码】

< python音频库：Windows下pydub安装配置、过程出现的问题及常用API >背景刚从B站上看过倒放挑战之后也想体验下，心血来潮一个晚上完成了基本的实现。其中倒放与播放部分使用了pydub这个音频库，十分快捷方便，但是它完整一套的配置让我还是踩了几个坑。特将其配置过程记录于此，方便大家。Windows10系统' ref='nofollow'>< Pydub in Github >安装PydubAnaconda：打开Anaconda prompt，activate切换至工作环境下，键入pip install ...

Python小工具：利用ffmpy3库3秒钟将视频转换为音频【代码】【图】

作者 | pk 哥来源公众号 | Python知识圈（ID：PythonCircle）最近，有读者微信上私聊我，想让我写一篇视频批量转换成音频的文章，我答应了，周末宅家里把这个小工具做出来了。这样，对于有些视频学习文件，我们可以批量转换成音频文件，学习方式更多样化了。之前也用过 ffmpeg 处理视频文件。ffmpeg 这个程序处理视频是好用，但是有没有更轻便的呢？可以不下载这个程序吗？还真有，Python 里有 ffmpeg 相关的库：ffmpy3。ffmpy3 是...

python爬虫之爬取音频【代码】

抓取“xmly”鬼故事音频import json # 在这个url，音频链接为JSON动态生成，所以用到了json模块import requests headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36" }# 请求网页def open_url(url):r = requests.get(url, headers=headers)r.encoding = ‘utf-8‘html = r.text# 将JSON转化成字符串html = json.loads(html)return ht...

Python中使用requests和parsel爬取喜马拉雅电台音频【代码】【图】

场景喜马拉雅电台：https://www.ximalaya.com/找到一步小说音频，这里以下面为例https://www.ximalaya.com/youshengshu/16411402/博客：https://blog.csdn.net/badao_liumang_qizhi关注公众号霸道的程序猿获取编程相关电子书、教程推送与免费下载。实现找到下载地址使用谷歌浏览器打开上面网址，按F12打开调试，点击播放按钮后，然后找到Network下的Media下的Headers下的RequestURL,然后选中在新窗口中打开打开之后就可以点击三...

Python音频处理【代码】

目录1. librosa1. librosapip install librosa但是，在Xubuntu 20.04环境上 import librosa 报错：ModuleNotFoundError: No module named ‘numba.decorators‘ 解决：使用最新的numba(0.50)导致错误，使用旧版本能解决问题：pip uninstall numba pip install ‘numba<=0.48‘ 接下来，加载音频文件再次出错：NoBackendError 。在ubuntu上，以下方式可以解决问题：sudo apt-get install libav-tools # 或者，最新版本的bantu： sud...

python 音频可视化【代码】

暂时记录。　　这里的简单原理就是获取声卡输入输出设备中的数据（注意驱动什么的没有问题，能用麦克风），然后 matplotlib 绘制出来，想要看到音乐的节奏振动就再 fft 一下。至于如何不断更新波形，matplotlib 有一个 animation 方法可以用（见下面第二种方法），但实际上我用了之后发现显示效果不如第一种（可能是姿势不对）。之前用 matlab 做的，也很不错。　　第一种方法（波形显示更流畅，代码参考这个视频）：from _tkinter...

Python音频信号分类MFCC特征神经网络【代码】

我正在尝试将语音信号从语音到情感进行分类.为此,我要提取音频信号的MFCC特征并将其馈入一个简单的神经网络(由PyBrain的BackpropTrainer训练的FeedForwardNetwork).不幸的是,结果非常糟糕.因此,从5个班级中,网络似乎几乎总是提出相同的班级. 我有5种情感类别和大约7000个带有标签的音频文件,我将其划分为每种情感类别的80％用于训练网络,而20％用于测试网络. 想法是使用小窗口并从中提取MFCC功能,以生成许多训练示例.在评估中,将评...

使用python怎么播放音频【图】

使用 python 播放音频有以下几种方式：os.system()os.system(file) 调用系统应用来打开文件，file 可为图片或者音频文件。缺点：要打开具体的应用，不能在后台播放音频。pyaudio安装：pip install pyaudio官方提供了播放音频与录音的 api ，使用十分方便，只要把Filename更改为你的音频文件的文字，就可以播放音频了。"""PyAudio Example: Play a WAVE file.""" import pyaudio import wave CHUNK = 1024 FILENAME = 你的音频文件 ...

Python爬虫之音频数据实例【图】

一：前言本次爬取的是喜马拉雅的热门栏目下全部电台的每个频道的信息和频道中的每个音频数据的各种信息，然后把爬取的数据保存到mongodb以备后续使用。这次数据量在70万左右。音频数据包括音频下载地址，频道信息，简介等等，非常多。昨天进行了人生中第一次面试，对方是一家人工智能大数据公司，我准备在这大二的暑假去实习，他们就要求有爬取过音频数据，所以我就来分析一下喜马拉雅的音频数据爬下来。目前我还在等待三面中，或者...

python通过wxPython打开一个音频文件并播放的方法

本文实例讲述了python通过wxPython打开一个音频文件并播放的方法。分享给大家供大家参考。具体如下：这段代码片段使用wx.lib.filebrowsebutton.FileBrowseButton控件打开一个wav文件，使用wx.Sound播放import wx import wx.lib.filebrowsebutton class MyFrame(wx.Frame):def __init__(self, parent, mytitle, mysize):wx.Frame.__init__(self, parent, wx.ID_ANY, mytitle,size=mysize)self.SetBackgroundColour("green")panel =...

处理音频文件的python模块【代码】

首先是wavedef read_wav_data(filename):读取一个wav文件，返回声音信号的时域谱矩阵和播放时间filename="/home/chenyang/"+filename[2:]with wave.open(filename,"rb") as wav: # 打开一个wav格式的声音文件流num_frame = wav.getnframes() # 获取帧数num_channel=wav.getnchannels() # 获取声道数framerate=wav.getframerate() # 获取帧速率num_sample_width=wav.getsampwidth() # 获取实例的比特宽度，即每一帧的字节数str_data...

python 可以从视频中直接剪辑音频出来（亲测MP4）【代码】

import os from moviepy.video.io.VideoFileClip import VideoFileClip from pydub import AudioSegment def clip_video(source_file, target_file, start_time, stop_time): """ 利用moviepy进行视频剪切 :param source_file: 原视频的路径，mp4格式 :param target_file: 生成的目标视频路径，mp4格式 :param start_time: 剪切的起始时间点（第start_time秒） :param stop_time: 剪切的结束时间点（第stop_time秒...

python自学-飞机大战的简单实现（附带相关音频图片资料）【代码】【图】

飞机大战音频图片资料包（百度网盘）链接：https://pan.baidu.com/s/1MY_oHjB5vr-5oAWMeLnTWQ 提取码：txm0 1.创建游戏窗口 import pygame screen=pygame.display.set_mode((800,600),0,32) #创建一个游戏窗体 while True:pygame.display.update() #消息循环，更新消息2.载入背景 import pygame screen=pygame.display.set_mode((480,650),0,32) #创建一个游戏窗体 #bk=pygame.image.load("D:\\Python代码\\class28\\images\\b...

Python爬取酷狗MP3音频【代码】

分析问题音频url 点入某个音乐的播放界面，通过F12-Network，分析数据，可以看到有一个index.php?..返回数据中有一个play_url，打开后正是我们需要的音频。查看该url的headers，其params参数如下，通过反复不同的几次尝试，得知r、callback、dfid、mid、platid这几项不变，而通过初步的requests尝试，发现最后一项_可有可无，改变的只有hash和album_id两项。 r: play/getdata callback: jQuery1910861615852090795_1612578519454...

带有Python的音频处理（附带源码）

由于博客播放不了音频，所以音频将以视频形式展现。公众号也正在进行抽书音频素材请点击这里进行观看往下拉就是文章地址有时，在进行编程时，我们需要进行一些音频处理。编程中最常用的音频处理任务包括–加载和保存音频文件，将音频文件拆分和追加到片段，使用不同的数据创建混合音频文件，操纵声音级别，应用一些过滤器以及生成音频调整和也许更多。所有这些东西都可以使用 Python来实现。Python是一种灵活的语言。它为您听说...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / 在python中的单词上拆分语音音频文件

在python中的单词上拆分语音音频文件

内容导读

内容图文

内容总结

内容备注

内容手机端

【在python中的单词上拆分语音音频文件】教程文章相关的互联网学习教程文章

< python音频库：Windows下pydub安装配置、过程出现的问题及常用API >【代码】

Python小工具：利用ffmpy3库3秒钟将视频转换为音频【代码】【图】

python爬虫之爬取音频【代码】

Python中使用requests和parsel爬取喜马拉雅电台音频【代码】【图】

Python音频处理【代码】

python 音频可视化【代码】

Python音频信号分类MFCC特征神经网络【代码】

使用python怎么播放音频【图】

Python爬虫之音频数据实例【图】

python通过wxPython打开一个音频文件并播放的方法

处理音频文件的python模块【代码】

python 可以从视频中直接剪辑音频出来（亲测MP4）【代码】

python自学-飞机大战的简单实现（附带相关音频图片资料）【代码】【图】

Python爬取酷狗MP3音频【代码】

带有Python的音频处理（附带源码）

PYTHON - 相关标签

文件 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程