-
当单击按钮时运行Speech_recognition时,UI冻结
我创建了一个python文件,单击“开始”时,麦克风应该可以工作并开始通话;如果我停止了,它应该将 -
如何使用R将IBM Watson语音中的语言更改为文本?
我正在用西班牙语转录各种mp3文件。我想通过R使用IBM Watson的语音文本API,并遵循本教程(<a href="http://rp -
语音到文本的转换
我正在为语音文件进行语音到文本的处理。我正在使用Google API将调用转换为文本。在转换过程中,我使 -
为什么来自Azure的语音转文本这么慢?
我正在使用Azure Speech To Text API识别从10秒到1分钟的小口语录音。 每次语音识别大约需要5秒钟才能完成, -
语音数据格式在Speech Studio中被拒绝
我正在将音频数据的zip文件上传到Speech Studio中的“自定义语音”项目。但是,文件在上传后将被拒绝。< -
有没有办法将我的Google Home Mini连接到python,以便我可以将语音文本发送到python解释器进行解析
我想做一个辅助项目,只是想知道如何将我的Google Home mini连接到python代码?如果我可以将用户发送的语 -
Google Speech Recognition API输出错误,不确定为什么会发生
这是我将flac文件输入Google的语音识别API时的输出。它说,如果启动并完成了大多数文件,但在即将结束 -
多次调用SpeechKit函数结果
我正在使用SpeechKit将语音返回到文本列表中。例如列出杂货店清单。但是我不断获得多个价值。我没什 -
使用python从零开始构建语音到文本系统
我需要语音转文本系统,以便可以将音频文件转录为文本格式。 在进行研究时,我发现了由大公司(例 -
chrome和Firefox中的文本语音转换
我想用语音来发短信。但是webkitSpeechRecognition仅在chrome上受支持,因此,如何将“语音”引入到Firefox和 -
Google Cloud Speech to Text LongRunningRecognize真的那么慢吗?
我制作了一个python脚本,将大约一个小时的mp3分成5分钟,然后将其转换为flac并上传到Google存储桶,我正 -
Google语音对文本跳过句子
此刻,我正在测试不同的语音到文本提供程序,而当测试Google的语音到文本提供程序时,我发现他们的 -
如何只获得可识别的文本?
我使用Azure语音在python中发短信 <pre><code>import azure.cognitiveservices.speech as speechsdk var = lambda evt: print(& -
为什么Speech_recognition不再起作用?
几天前,我使用了以下代码,并且工作正常,但是现在它无法识别以前识别的任何音频文件。我想知道 -
Google语音文本API示例代码将无法运行
我一直在不断阅读说明(设置项目,使用服务帐户密钥将环境变量设置为JSON文件的文件路径,安装/初始 -
Microsoft语音文本Python SDK无效标题SPXERR_INVALID_HEADER问题
将<a href="https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/quickstarts/speech-to-text-from-file?tabs=linux& -
语音识别如何识别5和5之间的差异?
我正在尝试制作一个语音计算器,它的工作效率约为70%,但问题是有时不是5,而是将字符串视为5,然 -
有没有一种方法可以记录音频并开始听点击声,然后将其存储在我们的本地计算机上并将其从语音转换为文本?
有没有一种方法可以录制音频并在点击时开始聆听,当用户停止讲话时自动停止,将录制的音频存储在 -
Microsoft Bot Framework v4语音服务
我已经开发了Microsoft bot框架节点js bot并连接到Facebook。当我尝试使用Facebook mic向Bot添加语音服务时,出 -
如何停止Microsoftognitive-services-speech-sdk-js停止手动收听?
我已经使用<a href="https://github.com/microsoft/cognitive-services-speech-sdk-js" rel="nofollow noreferrer">Cognitive Services</a> -
为什么PyAudio运行这么慢?
以下是一起充当实时语音识别软件的脚本。一个在python中,另一个在批处理(Windows)中。它使用PyAudio。 -
为什么挪威语的语音转文本使用“særskriving”而不是正确的语法?
当我对服务说复合词时,它将几乎本能地在不应出现的词之间添加空格,就好像这是规则本身一样。一 -
从浏览器检测是否在设备上启用了语音输入
通常情况是这样,我们有一个网页,我希望允许用户使用语音来填充较大的输入,而不是键入。我想检 -
当我尝试运行此程序时,我尝试构建一个简单的语音识别(语音到文本)Python程序
<pre><code>import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: audio = r.listen(source) try: print(& -
训练MS自定义语音模型以识别虚线ID
我想使我的Microsoft自定义语音模型能够识别包含数字,字符和破折号的指示符,例如:<code>12-34 A-56 B78</c -
谷歌云语音到文本长音频响应
我正在尝试将音频转换为文本,但是得到的结果是 <pre><code>LongRunningRecognizeResponse { results: [] } </code></ -
OSError:使用CoLAB没有可用的默认输入设备
无法在CoLAB中使用SpeechRecognition库。 代码: <pre><code>import speech_recognition as sr r = sr.Recognizer() wit -
实施Google语音转文本时,Android主线程UI没有响应。怎么解决?
当前,我正在我的项目中实施google Speech to Text。引用的示例代码是:<a href="https://github.com/GoogleCloudPlatform -
Google Speech to Text-无法将输出写入文本文件
我正在尝试写入文本文件。似乎每次都失败。我可以编写.write(“ test”),但将google转录输出写入文件 -
我的代码存在问题,如何检查变量是否存在
完整代码 <pre><code> import speech_recognition as sr adLoop = True detector = sr.Recognizer() with sr.Microphone() as source: