-
如何在 google_recognize() 中添加替代语言。是否有可能?
我的代码: <pre><code>with sr.Microphone() as source: audio = r.listen(source) try: print("You said: " + -
查找包含字符串的列表子集的索引
我正在用 Python 处理 NLP,我已将音频文件转换为文本,然后找到语音中每个单词的时间偏移量,然后将 -
属性错误(使用 Spafe 的 Python PNCC)模块“scipy”没有属性“fftpack”
我正在尝试使用此处提供的 Spafe 项目提取语音特征 <a href="https://github.com/SuperKogito/spafe/blob/master/exam -
对话中特定个人的 Speech to Text
我是语音识别的新手。 我有兴趣构建一个工具,让我可以在对话和噪音中记录特定用户的讲话。</p -
如何在 WolframAlpha Python 中添加语音识别功能
所以我已经能够在我的 python 脚本上设置 WolframAlpha。所以当我输入我的命令时,它会返回一个答案。但 -
在 Windows 上使用 Azure Speech SDK 时,如何获取用于创建 AudioConfig 类的设备名称
我正在创建一个 Windows 客户端来使用 Azure Speech SDK 翻译语音。作为其中的一部分,我们需要创建一个 Audi -
合成音频文件时 TTS.speechRate() 会影响吗?
我有两种方法,<code>setSpeechRate(Float value)</code> 和 <code>public int synthesizeToFile(final CharSequence text, final Bundle -
为什么我的混淆矩阵报告值为零
所以我尝试对文本进行一些语音识别,代码成功地将语音数据预测为文本输出。然后,我想使用混淆矩 -
Python语音识别音频的最小激活能级
我的用例是智能树莓派婴儿电话。只有当说出超过一定“响度”的某些词时,它才应该被激活并触发警 -
自定义语音模型的自动化训练
我正在处理一个为 Azure 聊天机器人创建自定义语音模型的需求。我在 <a href="https://speech.microsoft.com" rel="n -
实时电话通话音频的消耗
我需要在应用程序中使用实时代理呼叫对话。这是为了在实时通话中执行一些语音分析,如文本到语音 -
谷歌云语音转文字支持任何浏览器?这在 Safari 上有效吗?
是否有任何地方可以验证 Google 云语音转文本支持的浏览器? 我们希望将其集成到我们的云解决方 -
在 Python 语音识别中使用双语言
如何在 Python 语音识别中添加更多语言?我尝试了以下代码,但没有用。 :( <pre><code> with speech_recogni -
如何在Python中使用speech_recognition获取单词时间戳?
我想确定音频文件中的语音准确开始和结束的时间。首先,我使用speech_recognition库来确定音频文件的语 -
表达性 TTS 需要多少小时的数据集,特别是在乌尔都语的背景下
我想为乌尔都语的表达性 TTS 开发一个数据集,需要多少小时的数据集。