speech-to-text

当单击按钮时运行Speech_recognition时，UI冻结

我创建了一个python文件，单击“开始”时，麦克风应该可以工作并开始通话；如果我停止了，它应该将

前端之家
2022-08-16 • 问答
如何使用R将IBM Watson语音中的语言更改为文本？

我正在用西班牙语转录各种mp3文件。我想通过R使用IBM Watson的语音文本API，并遵循本教程（<a href="http://rp

前端之家
2022-08-16 • 问答
语音到文本的转换

我正在为语音文件进行语音到文本的处理。我正在使用Google API将调用转换为文本。在转换过程中，我使

前端之家
2022-08-16 • 问答
为什么来自Azure的语音转文本这么慢？

我正在使用Azure Speech To Text API识别从10秒到1分钟的小口语录音。每次语音识别大约需要5秒钟才能完成，

前端之家
2022-08-16 • 问答
语音数据格式在Speech Studio中被拒绝

我正在将音频数据的zip文件上传到Speech Studio中的“自定义语音”项目。但是，文件在上传后将被拒绝。<

前端之家
2022-08-16 • 问答
有没有办法将我的Google Home Mini连接到python，以便我可以将语音文本发送到python解释器进行解析

我想做一个辅助项目，只是想知道如何将我的Google Home mini连接到python代码？如果我可以将用户发送的语

前端之家
2022-08-16 • 问答
Google Speech Recognition API输出错误，不确定为什么会发生

这是我将flac文件输入Google的语音识别API时的输出。它说，如果启动并完成了大多数文件，但在即将结束

前端之家
2022-08-16 • 问答
多次调用SpeechKit函数结果

我正在使用SpeechKit将语音返回到文本列表中。例如列出杂货店清单。但是我不断获得多个价值。我没什

前端之家
2022-08-15 • 问答
使用python从零开始构建语音到文本系统

我需要语音转文本系统，以便可以将音频文件转录为文本格式。在进行研究时，我发现了由大公司（例

前端之家
2022-08-15 • 问答
chrome和Firefox中的文本语音转换

我想用语音来发短信。但是webkitSpeechRecognition仅在chrome上受支持，因此，如何将“语音”引入到Firefox和

前端之家
2022-08-15 • 问答
Google Cloud Speech to Text LongRunningRecognize真的那么慢吗？

我制作了一个python脚本，将大约一个小时的mp3分成5分钟，然后将其转换为flac并上传到Google存储桶，我正

前端之家
2022-08-15 • 问答
Google语音对文本跳过句子

此刻，我正在测试不同的语音到文本提供程序，而当测试Google的语音到文本提供程序时，我发现他们的

前端之家
2022-08-15 • 问答
如何只获得可识别的文本？

我使用Azure语音在python中发短信 <pre><code>import azure.cognitiveservices.speech as speechsdk var = lambda evt: print(&

前端之家
2022-08-15 • 问答
为什么Speech_recognition不再起作用？

几天前，我使用了以下代码，并且工作正常，但是现在它无法识别以前识别的任何音频文件。我想知道

前端之家
2022-08-15 • 问答
Google语音文本API示例代码将无法运行

我一直在不断阅读说明（设置项目，使用服务帐户密钥将环境变量设置为JSON文件的文件路径，安装/初始

前端之家
2022-08-14 • 问答
Microsoft语音文本Python SDK无效标题SPXERR_INVALID_HEADER问题

将<a href="https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/quickstarts/speech-to-text-from-file?tabs=linux&

前端之家
2022-08-14 • 问答
语音识别如何识别5和5之间的差异？

我正在尝试制作一个语音计算器，它的工作效率约为70％，但问题是有时不是5，而是将字符串视为5，然

前端之家
2022-08-14 • 问答
有没有一种方法可以记录音频并开始听点击声，然后将其存储在我们的本地计算机上并将其从语音转换为文本？

有没有一种方法可以录制音频并在点击时开始聆听，当用户停止讲话时自动停止，将录制的音频存储在

前端之家
2022-08-14 • 问答
Microsoft Bot Framework v4语音服务

我已经开发了Microsoft bot框架节点js bot并连接到Facebook。当我尝试使用Facebook mic向Bot添加语音服务时，出

前端之家
2022-08-14 • 问答
如何停止Microsoftognitive-services-speech-sdk-js停止手动收听？

我已经使用<a href="https://github.com/microsoft/cognitive-services-speech-sdk-js" rel="nofollow noreferrer">Cognitive Services</a>

前端之家
2022-08-14 • 问答
为什么PyAudio运行这么慢？

以下是一起充当实时语音识别软件的脚本。一个在python中，另一个在批处理（Windows）中。它使用PyAudio。

前端之家
2022-08-14 • 问答
为什么挪威语的语音转文本使用“særskriving”而不是正确的语法？

当我对服务说复合词时，它将几乎本能地在不应出现的词之间添加空格，就好像这是规则本身一样。一

前端之家
2022-08-14 • 问答
从浏览器检测是否在设备上启用了语音输入

通常情况是这样，我们有一个网页，我希望允许用户使用语音来填充较大的输入，而不是键入。我想检

前端之家
2022-08-13 • 问答
当我尝试运行此程序时，我尝试构建一个简单的语音识别（语音到文本）Python程序

<pre><code>import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: audio = r.listen(source) try: print(&

前端之家
2022-08-13 • 问答
训练MS自定义语音模型以识别虚线ID

我想使我的Microsoft自定义语音模型能够识别包含数字，字符和破折号的指示符，例如：<code>12-34 A-56 B78</c

前端之家
2022-08-13 • 问答
谷歌云语音到文本长音频响应

我正在尝试将音频转换为文本，但是得到的结果是 <pre><code>LongRunningRecognizeResponse { results: [] } </code></

前端之家
2022-08-13 • 问答
OSError：使用CoLAB没有可用的默认输入设备

无法在CoLAB中使用SpeechRecognition库。代码： <pre><code>import speech_recognition as sr r = sr.Recognizer() wit

前端之家
2022-08-12 • 问答
实施Google语音转文本时，Android主线程UI没有响应。怎么解决？

当前，我正在我的项目中实施google Speech to Text。引用的示例代码是：<a href="https://github.com/GoogleCloudPlatform

前端之家
2022-08-12 • 问答
Google Speech to Text-无法将输出写入文本文件

我正在尝试写入文本文件。似乎每次都失败。我可以编写.write（“ test”），但将google转录输出写入文件

前端之家
2022-08-12 • 问答
我的代码存在问题，如何检查变量是否存在

完整代码 <pre><code> import speech_recognition as sr adLoop = True detector = sr.Recognizer() with sr.Microphone() as source:

前端之家
2022-08-12 • 问答

首页

下一页
末页