-
Azure语音转文本cURL调用失败
我正在遵循故障排除指南<a href="https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/troubleshooting" rel=" -
从框架分组MFCC
在为音频信号的各个帧计算MFCC时,将MFCC的矩阵x时间帧数推广到信号的单个MFCC集是否明智?如果是,那 -
当单击按钮时运行Speech_recognition时,UI冻结
我创建了一个python文件,单击“开始”时,麦克风应该可以工作并开始通话;如果我停止了,它应该将 -
适用于0.6的Mozilla DeepSpeech模型
我正在尝试在<a href="https://github.com/mozilla/DeepSpeech" rel="nofollow noreferrer">https://github.com/mozilla/DeepSpeech</a>的W -
如果我不说什么,语音识别就会停止,如何使其保持聆听
想要创建2个按钮,一个开始语音识别,并保持打开状态,直到我单击按钮完成为止。问题是当我单击“ -
如何将自动生成的注册ID更改/分配给Microsoft Azure认知演讲者识别API中的特定人名
我正在尝试使用Microsoft Speaker Identification API。有3个步骤 <ol> <li>第一步,我们使用自动生成的ID创建 -
对于不在词典中的单词,将音频转换为音素的最佳,最简便的方法
我正试图为人名使用音素词典,这些人使用不在CMUDict中的单词。最佳和最简单的方法是什么?我了解您 -
Python语音识别KeyError BufferedReader
我正在使用Python中的语音识别包对某些音频文件进行转码,并且在记录文件时遇到KeyError(io.BufferedReader -
多次调用SpeechKit函数结果
我正在使用SpeechKit将语音返回到文本列表中。例如列出杂货店清单。但是我不断获得多个价值。我没什 -
是否有任何API在Tensorflow中训练ASR模型
我想知道在tensorflow中是否有用于训练自定义数据上的ASR模型的特定高级api。如果不存在,将来还会有一 -
使用python从零开始构建语音到文本系统
我需要语音转文本系统,以便可以将音频文件转录为文本格式。 在进行研究时,我发现了由大公司(例 -
chrome和Firefox中的文本语音转换
我想用语音来发短信。但是webkitSpeechRecognition仅在chrome上受支持,因此,如何将“语音”引入到Firefox和 -
ionic 5 cordova语音识别器如何语音发短信?
我正在尝试在开始收听语音时捕获文本,但是我不知道如何实现。 这是我当前拥有的代码: <p -
为什么Speech_recognition不再起作用?
几天前,我使用了以下代码,并且工作正常,但是现在它无法识别以前识别的任何音频文件。我想知道 -
如何计算到神经网络Tensorflow Lite的输入以进行语音命令识别?
我一直在遵循本教程来创建<a href="https://www.tensorflow.org/tutorials/sequences/audio_recognition" rel="nofollow noreferrer"> -
AttributeError:尝试从麦克风获取输入时__enter__
我一直在尝试使用Speech_recognition从我的python程序中的麦克风获取输入 我尝试运行以下代码:- < -
Microsoft语音文本Python SDK无效标题SPXERR_INVALID_HEADER问题
将<a href="https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/quickstarts/speech-to-text-from-file?tabs=linux& -
我怎么知道我的应用是由Google Assistant打开的,而不是正常启动的
我怎么知道我的应用是由Google Assistant打开的,而不是正常启动的。 我不需要应用程序操作。我只想知道 -
在esp32上录制音频并通过蓝牙将其发送到android应用
我想从esp32开始一个项目,该项目将录制drom麦克风中的音频并将其发送到android应用,该应用将仅检测用 -
运行非脱机语言时的SpeechRecognizer ERROR_SERVER
当我将英语设置为默认语言运行此程序时,一切都很好,但是,即使我打开了Internet连接,当我使用任何 -
语音识别如何识别5和5之间的差异?
我正在尝试制作一个语音计算器,它的工作效率约为70%,但问题是有时不是5,而是将字符串视为5,然 -
python Speech_recognition库在收听音频文件时的意外行为
<a href="https://github.com/Uberi/speech_recognition/files/3840074/test100.zip.zip" rel="nofollow noreferrer">test100.zip.zip</a> -
卡尔迪(Kaldi)法规中用于呕吐的方法
您能否简要说明一下呕吐配方中使用的方法(例如,单音,第一三音系统,LDA + MLLT系统,SAT系统,SGMM2 -
如何停止Microsoftognitive-services-speech-sdk-js停止手动收听?
我已经使用<a href="https://github.com/microsoft/cognitive-services-speech-sdk-js" rel="nofollow noreferrer">Cognitive Services</a> -
如何在ASR训练中匹配输入和目标的序列长度?
我正在尝试使用Keras为ASR建立LSTM网络。我正在使用TIMIT数据集进行训练,但是预处理中存在问题。 预处 -
当我尝试运行此程序时,我尝试构建一个简单的语音识别(语音到文本)Python程序
<pre><code>import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: audio = r.listen(source) try: print(& -
Android SpeechRecognition上的麦克风停止工作 我正在使用
我在使用react native制作的应用程序上使用android SpeechRecognition。使用的库是react-native-voice。 该应用 -
试图用tkinter gui停止Python语音识别循环
<p >> 世界,您好, 我目前正在构建一个机器人(ApplePI),当然,为了与我交谈,它需要语音识别(S -
在python中练习语音识别时,麦克风不会自行关闭
我正在尝试使用麦克风将语音转换为文本,并在最后打印输出。由于某种原因,它没有检测到任何东西 -
谷歌云语音到文本长音频响应
我正在尝试将音频转换为文本,但是得到的结果是 <pre><code>LongRunningRecognizeResponse { results: [] } </code></