speech-recognition

Azure语音转文本cURL调用失败

我正在遵循故障排除指南<a href="https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/troubleshooting" rel="

前端之家
2022-08-16 • 问答
从框架分组MFCC

在为音频信号的各个帧计算MFCC时，将MFCC的矩阵x时间帧数推广到信号的单个MFCC集是否明智？如果是，那

前端之家
2022-08-16 • 问答
当单击按钮时运行Speech_recognition时，UI冻结

我创建了一个python文件，单击“开始”时，麦克风应该可以工作并开始通话；如果我停止了，它应该将

前端之家
2022-08-16 • 问答
适用于0.6的Mozilla DeepSpeech模型

我正在尝试在<a href="https://github.com/mozilla/DeepSpeech" rel="nofollow noreferrer">https://github.com/mozilla/DeepSpeech</a>的W

前端之家
2022-08-16 • 问答
如果我不说什么，语音识别就会停止，如何使其保持聆听

想要创建2个按钮，一个开始语音识别，并保持打开状态，直到我单击按钮完成为止。问题是当我单击“

前端之家
2022-08-16 • 问答
如何将自动生成的注册ID更改/分配给Microsoft Azure认知演讲者识别API中的特定人名

我正在尝试使用Microsoft Speaker Identification API。有3个步骤 <ol> <li>第一步，我们使用自动生成的ID创建

前端之家
2022-08-16 • 问答
对于不在词典中的单词，将音频转换为音素的最佳，最简便的方法

我正试图为人名使用音素词典，这些人使用不在CMUDict中的单词。最佳和最简单的方法是什么？我了解您

前端之家
2022-08-16 • 问答
Python语音识别KeyError BufferedReader

我正在使用Python中的语音识别包对某些音频文件进行转码，并且在记录文件时遇到KeyError（io.BufferedReader

前端之家
2022-08-15 • 问答
多次调用SpeechKit函数结果

我正在使用SpeechKit将语音返回到文本列表中。例如列出杂货店清单。但是我不断获得多个价值。我没什

前端之家
2022-08-15 • 问答
是否有任何API在Tensorflow中训练ASR模型

我想知道在tensorflow中是否有用于训练自定义数据上的ASR模型的特定高级api。如果不存在，将来还会有一

前端之家
2022-08-15 • 问答
使用python从零开始构建语音到文本系统

我需要语音转文本系统，以便可以将音频文件转录为文本格式。在进行研究时，我发现了由大公司（例

前端之家
2022-08-15 • 问答
chrome和Firefox中的文本语音转换

我想用语音来发短信。但是webkitSpeechRecognition仅在chrome上受支持，因此，如何将“语音”引入到Firefox和

前端之家
2022-08-15 • 问答
ionic 5 cordova语音识别器如何语音发短信？

我正在尝试在开始收听语音时捕获文本，但是我不知道如何实现。这是我当前拥有的代码： <p

前端之家
2022-08-15 • 问答
为什么Speech_recognition不再起作用？

几天前，我使用了以下代码，并且工作正常，但是现在它无法识别以前识别的任何音频文件。我想知道

前端之家
2022-08-15 • 问答
如何计算到神经网络Tensorflow Lite的输入以进行语音命令识别？

我一直在遵循本教程来创建<a href="https://www.tensorflow.org/tutorials/sequences/audio_recognition" rel="nofollow noreferrer">

前端之家
2022-08-15 • 问答
AttributeError：尝试从麦克风获取输入时__enter__

我一直在尝试使用Speech_recognition从我的python程序中的麦克风获取输入我尝试运行以下代码：- <

前端之家
2022-08-15 • 问答
Microsoft语音文本Python SDK无效标题SPXERR_INVALID_HEADER问题

将<a href="https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/quickstarts/speech-to-text-from-file?tabs=linux&

前端之家
2022-08-14 • 问答
我怎么知道我的应用是由Google Assistant打开的，而不是正常启动的

我怎么知道我的应用是由Google Assistant打开的，而不是正常启动的。我不需要应用程序操作。我只想知道

前端之家
2022-08-14 • 问答
在esp32上录制音频并通过蓝牙将其发送到android应用

我想从esp32开始一个项目，该项目将录制drom麦克风中的音频并将其发送到android应用，该应用将仅检测用

前端之家
2022-08-14 • 问答
运行非脱机语言时的SpeechRecognizer ERROR_SERVER

当我将英语设置为默认语言运行此程序时，一切都很好，但是，即使我打开了Internet连接，当我使用任何

前端之家
2022-08-14 • 问答
语音识别如何识别5和5之间的差异？

我正在尝试制作一个语音计算器，它的工作效率约为70％，但问题是有时不是5，而是将字符串视为5，然

前端之家
2022-08-14 • 问答
python Speech_recognition库在收听音频文件时的意外行为

<a href="https://github.com/Uberi/speech_recognition/files/3840074/test100.zip.zip" rel="nofollow noreferrer">test100.zip.zip</a>

前端之家
2022-08-14 • 问答
卡尔迪（Kaldi）法规中用于呕吐的方法

您能否简要说明一下呕吐配方中使用的方法（例如，单音，第一三音系统，LDA + MLLT系统，SAT系统，SGMM2

前端之家
2022-08-14 • 问答
如何停止Microsoftognitive-services-speech-sdk-js停止手动收听？

我已经使用<a href="https://github.com/microsoft/cognitive-services-speech-sdk-js" rel="nofollow noreferrer">Cognitive Services</a>

前端之家
2022-08-14 • 问答
如何在ASR训练中匹配输入和目标的序列长度？

我正在尝试使用Keras为ASR建立LSTM网络。我正在使用TIMIT数据集进行训练，但是预处理中存在问题。预处

前端之家
2022-08-13 • 问答
当我尝试运行此程序时，我尝试构建一个简单的语音识别（语音到文本）Python程序

<pre><code>import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: audio = r.listen(source) try: print(&

前端之家
2022-08-13 • 问答
Android SpeechRecognition上的麦克风停止工作我正在使用

我在使用react native制作的应用程序上使用android SpeechRecognition。使用的库是react-native-voice。该应用

前端之家
2022-08-13 • 问答
试图用tkinter gui停止Python语音识别循环

<p >> 世界，您好，我目前正在构建一个机器人（ApplePI），当然，为了与我交谈，它需要语音识别（S

前端之家
2022-08-13 • 问答
在python中练习语音识别时，麦克风不会自行关闭

我正在尝试使用麦克风将语音转换为文本，并在最后打印输出。由于某种原因，它没有检测到任何东西

前端之家
2022-08-13 • 问答
谷歌云语音到文本长音频响应

我正在尝试将音频转换为文本，但是得到的结果是 <pre><code>LongRunningRecognizeResponse { results: [] } </code></

前端之家
2022-08-13 • 问答

首页

下一页
末页