【python – 如何将音频添加到视频?】教程文章相关的互联网学习教程文章

python-通过websockets流音频IBM无法正常工作【代码】

我正在尝试使用IBM Watson通过websockets通过麦克风流式传输音频.我收到以下错误:TypeError: The system cannot find the file specified我认为子流程有问题,请帮助我纠正此问题/使其正常工作.from ws4py.client.threadedclient import WebSocketClient import base64, json, ssl, subprocess, threading, timeclass SpeechToTextClient(WebSocketClient):def __init__(self):ws_url = "wss://stream.watsonplatform.net/speech-t...

python-Qt4声子支持的音频格式吗?

我正在PyQt4中制作音乐播放器,并且正在使用Phonon播放音乐本身.该应用程序主要针对Windows,但我计划也支持Mac和Linux版本.我想知道的是Phonon支持哪种音频格式,这样我就可以确保用户仅输入这些文件.解决方法:您需要call availableMimeTypes() to check what formats the backend supports.

哪个Python库可用于OSX上的非阻塞音频I / O?

我想用Python读写音频.我尝试了PyAudio和audiolab,但是它们都只能阻止音频I / O(即,它们在播放或录制时不能做其他任何事情). 现在,我需要一个在OSX上执行非阻塞音频I / O的库. LGPL / BSD许可证的奖励积分,与pip的兼容性以及numpy数组的播放!解决方法:几天前,我向pyAudio提交了一个补丁程序,该补丁程序可以在此处启用非阻塞音频I / O. 从0.2.7版开始,该修补程序已安装.现在,PyAudio正式支持无阻塞I / O.

音频流Python上的Google流语音识别

我搜索了Google的所有可用文档,但找不到Python中音频流上的语音识别流示例. 当前,我正在Django中使用Python的语音识别来从用户那里获取音频,然后收听音频.然后,我可以保存文件并运行Google语音识别,或者直接从创建的音频实例中运行. 有人可以指导我如何对音频流执行流语音识别吗?解决方法:Google提供了流式Python API here的示例. 与其打开音频文件以创建流(如该示例的第34行),不如将其直接传递给音频样本对象(如第36行).

在python中实时播放原始音频文件【代码】

我在python中有一台udp服务器,该服务器不断以原始格式(字节数组)接收来自客户端的语音数据包.如何在服务器端实时播放声音?有推荐的库或方法吗? 如果需要,这是我非常简单的服务器代码(我对此表示怀疑)import socketUDP_IP = "192.168.1.105" UDP_PORT = 5005sock = socket.socket(socket.AF_INET, # Internetsocket.SOCK_DGRAM) # UDP sock.bind((UDP_IP, UDP_PORT))while True:data, addr = sock.recvfrom(1024) # buffer size i...

用Python调整OSX系统音频音量【代码】

我想从python脚本调整OSX中的系统音量.关于实现键盘快捷方式的This question告诉我如何在applescript中做到这一点,但是我真的很喜欢在不使用os.system,popen等的情况下从我的python脚本中完成它.理想情况下我想用一些缓慢增加音量像这样的python代码:set_volume(0) for i in range(50):set_volume(i*2)time.sleep(1)解决方法:使用appscript控制StandardAdditions scripting addition设置的卷命令:>>> from osax import * >>> imp...

python – 使用Alexa传输音频的最简单示例【代码】

我正在尝试使用新的流式音频API.以下回复是否有效?当我在我的设备上测试它时,我得到“技能有问题”错误. 这是我的AWS-lambda函数的代码:def lambda_handler(event, context):return {"response": {"directives": [{"type": "AudioPlayer.Play","playBehavior": "REPLACE_ALL","audioItem": {"stream": {"token": "12345","url": "http://emit-media-production.s3.amazonaws.com/pbs/the-afterglow/2016/08/24/1700/201608241700...

Python中的音频频率【代码】

我正在编写一个代码来分析由语音演唱的单个音频.我需要一种方法来分析音符的频率.目前我正在使用PyAudio来录制音频文件,该文件存储为.wav,然后立即播放.import numpy as np import pyaudio import wave# open up a wave wf = wave.open('file.wav', 'rb') swidth = wf.getsampwidth() RATE = wf.getframerate() # use a Blackman window window = np.blackman(chunk) # open stream p = pyaudio.PyAudio() stream = p.open(format ...

在python中的单词上拆分语音音频文件【代码】

我觉得这是一个相当普遍的问题,但我还没有找到合适的答案.我有许多人类语音的音频文件,我想在单词上打破,这可以通过查看波形中的暂停来启发式地完成,但是有人能指向我自动执行此操作的python中的函数/库吗?解决方法:更简单的方法是使用pydub模块.最近的silent utilities增加了所有的重任,如设置沉默threahold,设置沉默长度.与提到的其他方法相比,显着简化了代码. 这是一个演示实现,灵感来自here 设定: 我在“a-z.wav”文件中有一...

python – 使用rtmplite在Google App Engine中录制音频?

我正在构建一个Google App Engine应用程序,该应用程序需要录制音频并保存在我们的数据库中.我找不到使用某种形式的RTMP服务器通过闪存录制音频的替代方案,所以[rtmplite](http://code.google.com/p/rtmplite/)进入了我们的视野. 由于我没有使用rtmplite的经验,它是我们项目的正确选择吗?或者是否有其他基于Python的RTMP解决方案允许录音?您可以推荐任何Flash客户端吗? 谢谢!解决方法:对于RTMP,Google App Engine很棘手,因为它不...

python – 音频:在M4A和FLAC,WAV或raw之间转换

我正在处理通过Quicktime录制的音频并以.m4a格式保存.我想使用Google Cloud Provider的Speech API,他们的推荐是: 做:Use a lossless codec to record and transmit audio. FLAC or LINEAR16 is recommended. 避免:Using mp3, mp4, m4a, mu-law, a-law or other lossy codecs during recording or transmission may reduce accuracy. If your audio is already in an encoding not supported by the API, transcode it to loss...

python – 从音频CD中读取音轨的数量?【代码】

我正在写一个小脚本来分析音频CD.我正在寻找一种方法从CD中获取轨道数,无论是从shell脚本还是从Python中获取.是否有捷径可寻? 在Ubuntu 12.04衍生产品上.解决方法:的cdparanoia 您可以使用命令行工具cdparanoia获取CD音轨列表.$cdparanoia -sQ例$cdparanoia -sQ cdparanoia III release 10.2 (September 11, 2008)Table of contents (audio tracks only): track length begin copy pre ch ==========...

Python调用百度接口(情感倾向分析)和讯飞接口(语音识别、关键词提取)处理音频文件【代码】

本示例的过程是: 1. 音频转文本 2. 利用文本获取情感倾向分析结果 3. 利用文本获取关键词提取 首先是讯飞的语音识别模块。在这里可以找到非实时语音转写的相关文档以及 Python 示例。我略作了改动,让它可以对不同人说话作区分,并且作了一些封装。 语音识别功能 weblfasr_python3_demo.py 文件: 1 #!/usr/bin/env python2 # -*- coding: utf-8 -*-3 """4 讯飞非实时转写调用demo(语音识别)5 """6 import base647 import ha...

python – 如何解调(音频)莫尔斯电码【代码】

我有一个无线电接收器.收音机的声音输出到我的电脑.声音输出包含大约440 Hz的摩尔斯电码.莫尔斯电码的速度范围从2到20 WPM.我知道如何判断其他电台是否正在发送,但我如何处理发送/不发送状态并将其转换为文本?我认为可能有比蛮力更好的解决方案. 复杂因素: >我希望程序能够确定其他工作站的传输速度,而不是像大多数莫尔斯电码程序那样由用户指定.>有噪音>摩尔斯电码发射器不会立即打开和关闭.上升和下降时间大约为4毫秒.>大部分摩...

使用python通过多个通道播放音频【代码】

在python中有没有办法通过左右声道播放两个不同的单声道mp3文件? 我有两个mp3文件,我想通过左扬声器播放一个,另一个mp3通过右扬声器播放,以编程方式在python中播放.任何解决方案都可以.如果它是一个跨平台的解决方案,那么很棒.有没有人有什么建议?解决方法:有关简单的解决方案,请下载并试用audiere模块.这将打开第一个可用的音频设备:import audiere ds = audiere.open_device() os = ds.open_array(input_array, sampling_freq...