voice-recognition

将二进制文件转换为频谱图

我一直在寻找讨论将二进制文件转换为频谱图的任何解决方案/代码/线程。我发现的所有信息都是如何将

前端之家
2022-08-16 • 问答
如何将自动生成的注册ID更改/分配给Microsoft Azure认知演讲者识别API中的特定人名

我正在尝试使用Microsoft Speaker Identification API。有3个步骤 <ol> <li>第一步，我们使用自动生成的ID创建

前端之家
2022-08-16 • 问答
对于不在词典中的单词，将音频转换为音素的最佳，最简便的方法

我正试图为人名使用音素词典，这些人使用不在CMUDict中的单词。最佳和最简单的方法是什么？我了解您

前端之家
2022-08-16 • 问答
天秤座谱图对数形状

我正在使用Python中的Librosa从GTZAN数据集中提取对数梅尔-频谱图。我的代码- <pre><code>data, sampling_rate =

前端之家
2022-08-16 • 问答
梅尔-频谱图大小

我正在使用Python中的Librosa从GTZAN数据集中提取对数梅尔-频谱图。我的代码- <pre><code>data, sampling_rate =

前端之家
2022-08-16 • 问答
将可执行文件转换为模拟波形信号

我一直在尝试将数字二进制文件（.exe）转换为波形以收听生成的音频。我一直在寻找任何可能的软件/开

前端之家
2022-08-15 • 问答
基于深度学习的语音识别项目所需的最小音频样本数

我正在尝试基于我的大学的深度学习，开始一个与语音情感识别相关的项目。那么，对于一种情感，我

前端之家
2022-08-15 • 问答
如何将语音识别添加到Nao Bot

我需要在nao机器人上进行语音识别方面的帮助。在我的代码中，我启动了引擎，但是我不知道如何在内

前端之家
2022-08-15 • 问答
我怎么知道我的应用是由Google Assistant打开的，而不是正常启动的

我怎么知道我的应用是由Google Assistant打开的，而不是正常启动的。我不需要应用程序操作。我只想知道

前端之家
2022-08-14 • 问答
神经网络：布尔误差函数+ Mfcc（说话人识别）

--------------------------------------------------对不起，我的英语小伙子--------------------------------------------- ------

前端之家
2022-08-14 • 问答
我的说话人识别神经网络无法正常工作

我有一个第一年级的最终项目，我想建立一个神经网络，该网络将获取wav文件的前13个mfcc coeff并返回从

前端之家
2022-08-14 • 问答
有没有一种方法可以记录音频并开始听点击声，然后将其存储在我们的本地计算机上并将其从语音转换为文本？

有没有一种方法可以录制音频并在点击时开始聆听，当用户停止讲话时自动停止，将录制的音频存储在

前端之家
2022-08-14 • 问答
您可以将语音训练为文本以仅在android中识别您的语音吗？

我正在创建一个应用，我想识别用户的声音，而不是周围的声音。这可能吗？部分代码： <pre>

前端之家
2022-08-13 • 问答
什么是LENCE]在Amazon Transcribe中

[已编辑] 因此，我通过单击<code>create jobs</code>来使用Amazon Transcribe（<a href="https://aws.amazon.com/transc

前端之家
2022-08-13 • 问答
如何改善我的神经网络专业知识（说话者识别-MFCC）

我正在研究说话者识别神经网络。我正在做的是获取[Bing Bang理论的第一篇论文：-)的wav文件，而

前端之家
2022-08-12 • 问答
如何为我的Android计时器应用程序使用语音识别？

我有一个Android应用程序。 <a href="https://i.stack.imgur.com/OZ4gH.jpg" rel="nofollow noreferrer"><img src="https://i.s

前端之家
2022-08-12 • 问答
为什么我的代码未到达While循环以注册我的语音助手唤醒字？

我正在使用Python创建语音助手。我正在使用pyttsx3进行文本到语音转换，并且设置了唤醒密码来激活语音

前端之家
2022-08-12 • 问答
Nodejs-IBM Watson语音转文本Websocket连接错误

我一直在尝试遵循IBM（<a href="https://developer.ibm.com/tutorials/add-a-trigger-word-to-your-watson-assistant/" rel="nofollow no

前端之家
2022-08-12 • 问答
语音识别模块V3.1和蓝牙模块（HC-05）不能一起使用（Arduino）

Bluetooth模块（HC-05）和语音识别模块（V 3.1）可以与Arduino Uno一起正常工作，但是当我尝试同时运行它们

前端之家
2022-08-12 • 问答
如何使用python进行语音激活？

我正在用python做语音助手。像Google Assistant一样，我想实现一种在我说一些命令时触发事件的服务（就像G

前端之家
2022-08-11 • 问答
在Android中通过语音匹配进行访问

<h2>在Android中通过语音匹配进行访问以获取安全锁</h2> <hr /> 大家好，我想为android设置安全锁，其中将

前端之家
2022-08-11 • 问答
预期lstm_1的形状为（20，256），但数组的形状为（1，76）

我正在建立一个用于说话人识别的神经网络，我在尺寸方面遇到了问题，我在批处理生成器中一定做错

前端之家
2022-08-11 • 问答
Google离线语音识别无法正常工作

Lenovo 7305X中没有显示为“脱机语音识别”的选项。是因为设备不支持离线语音识别吗？

前端之家
2022-08-11 • 问答
语音到特定单词的文字

我写了一个程序来用python进行语音转文本，它运行良好。但我想为某些特定的单词或命令构建此文件。

前端之家
2022-08-09 • 问答
如何构建一个登录/注册系统，该系统从何处以及如何开始使用登录面部检测和注册音频

<strong>项目要求</strong>是用户应<strong>使用面部检测登录</strong>，如果未检测到则应要求<strong>注册</stron

前端之家
2022-08-08 • 问答
错误：---只能将str（而不是“ bytes”）连接到str

我正在ubuntu上的jupyter笔记本中做语音助手，但出现错误： <pre><code>can only concatenate str (not "bytes&#34

前端之家
2022-08-06 • 问答
在ubuntu 18.04上使用jupyter笔记本中的库阅读新闻时，语音助手中的语法错误

<pre><code>elif 'current weather' in command: reg_ex = re.search('current weather in (.*)', command) if reg_ex:

前端之家
2022-08-06 • 问答
在语音输入中找不到离线模式的泰米尔语

我无法添加泰米尔语语言以离线使用Google语音输入，因为它不会出现在下载语言列表中，任何人都知道

前端之家
2022-08-06 • 问答
SpeechRecognizer直接给出onError 5，然后给出7。无需等待几秒钟的输入

我有以下代码来启动SpeechRecognizer： <pre><code> fun startVoiceRecognitionActivityNoUI(value: VOICE_COMMANDS) { Log.i

前端之家
2022-08-05 • 问答
在C＃中执行唤醒单词语音识别的最佳方法是什么

我知道如何使它触发不同的短语，但是我想让一个SpeechRecognitionEngine监听一个唤醒词（例如：trigger），

前端之家
2022-08-05 • 问答

首页

下一页
末页