-
将二进制文件转换为频谱图
我一直在寻找讨论将二进制文件转换为频谱图的任何解决方案/代码/线程。我发现的所有信息都是如何将 -
如何将自动生成的注册ID更改/分配给Microsoft Azure认知演讲者识别API中的特定人名
我正在尝试使用Microsoft Speaker Identification API。有3个步骤 <ol> <li>第一步,我们使用自动生成的ID创建 -
对于不在词典中的单词,将音频转换为音素的最佳,最简便的方法
我正试图为人名使用音素词典,这些人使用不在CMUDict中的单词。最佳和最简单的方法是什么?我了解您 -
天秤座谱图对数形状
我正在使用Python中的Librosa从GTZAN数据集中提取对数梅尔-频谱图。我的代码- <pre><code>data, sampling_rate = -
梅尔-频谱图大小
我正在使用Python中的Librosa从GTZAN数据集中提取对数梅尔-频谱图。我的代码- <pre><code>data, sampling_rate = -
将可执行文件转换为模拟波形信号
我一直在尝试将数字二进制文件(.exe)转换为波形以收听生成的音频。我一直在寻找任何可能的软件/开 -
基于深度学习的语音识别项目所需的最小音频样本数
我正在尝试基于我的大学的深度学习,开始一个与语音情感识别相关的项目。 那么,对于一种情感,我 -
如何将语音识别添加到Nao Bot
我需要在nao机器人上进行语音识别方面的帮助。在我的代码中,我启动了引擎,但是我不知道如何在内 -
我怎么知道我的应用是由Google Assistant打开的,而不是正常启动的
我怎么知道我的应用是由Google Assistant打开的,而不是正常启动的。 我不需要应用程序操作。我只想知道 -
神经网络:布尔误差函数+ Mfcc(说话人识别)
--------------------------------------------------对不起,我的英语小伙子--------------------------------------------- ------ -
我的说话人识别神经网络无法正常工作
我有一个第一年级的最终项目,我想建立一个神经网络,该网络将获取wav文件的前13个mfcc coeff并返回从 -
有没有一种方法可以记录音频并开始听点击声,然后将其存储在我们的本地计算机上并将其从语音转换为文本?
有没有一种方法可以录制音频并在点击时开始聆听,当用户停止讲话时自动停止,将录制的音频存储在 -
您可以将语音训练为文本以仅在android中识别您的语音吗?
我正在创建一个应用,我想识别用户的声音,而不是周围的声音。这可能吗? 部分代码: <pre> -
什么是LENCE]在Amazon Transcribe中
[已编辑] 因此,我通过单击<code>create jobs</code>来使用Amazon Transcribe(<a href="https://aws.amazon.com/transc -
如何改善我的神经网络专业知识(说话者识别-MFCC)
我正在研究说话者识别神经网络。 我正在做的是获取[Bing Bang理论的第一篇论文:-)的wav文件,而 -
如何为我的Android计时器应用程序使用语音识别?
我有一个Android应用程序。 <a href="https://i.stack.imgur.com/OZ4gH.jpg" rel="nofollow noreferrer"><img src="https://i.s -
为什么我的代码未到达While循环以注册我的语音助手唤醒字?
我正在使用Python创建语音助手。我正在使用pyttsx3进行文本到语音转换,并且设置了唤醒密码来激活语音 -
Nodejs-IBM Watson语音转文本Websocket连接错误
我一直在尝试遵循IBM(<a href="https://developer.ibm.com/tutorials/add-a-trigger-word-to-your-watson-assistant/" rel="nofollow no -
语音识别模块V3.1和蓝牙模块(HC-05)不能一起使用(Arduino)
Bluetooth模块(HC-05)和语音识别模块(V 3.1)可以与Arduino Uno一起正常工作,但是当我尝试同时运行它们 -
如何使用python进行语音激活?
我正在用python做语音助手。像Google Assistant一样,我想实现一种在我说一些命令时触发事件的服务(就像G -
在Android中通过语音匹配进行访问
<h2>在Android中通过语音匹配进行访问以获取安全锁</h2> <hr /> 大家好,我想为android设置安全锁,其中将 -
预期lstm_1的形状为(20,256),但数组的形状为(1,76)
我正在建立一个用于说话人识别的神经网络,我在尺寸方面遇到了问题,我在批处理生成器中一定做错 -
Google离线语音识别无法正常工作
Lenovo 7305X中没有显示为“脱机语音识别”的选项。是因为设备不支持离线语音识别吗? -
语音到特定单词的文字
我写了一个程序来用python进行语音转文本,它运行良好。但我想为某些特定的单词或命令构建此文件。 -
如何构建一个登录/注册系统,该系统从何处以及如何开始使用登录面部检测和注册音频
<strong>项目要求</strong>是用户应<strong>使用面部检测登录</strong>,如果未检测到则应要求<strong>注册</stron -
错误:---只能将str(而不是“ bytes”)连接到str
我正在ubuntu上的jupyter笔记本中做语音助手,但出现错误: <pre><code>can only concatenate str (not "bytes" -
在ubuntu 18.04上使用jupyter笔记本中的库阅读新闻时,语音助手中的语法错误
<pre><code>elif 'current weather' in command: reg_ex = re.search('current weather in (.*)', command) if reg_ex: -
在语音输入中找不到离线模式的泰米尔语
我无法添加泰米尔语语言以离线使用Google语音输入,因为它不会出现在下载语言列表中,任何人都知道 -
SpeechRecognizer直接给出onError 5,然后给出7。无需等待几秒钟的输入
我有以下代码来启动SpeechRecognizer: <pre><code> fun startVoiceRecognitionActivityNoUI(value: VOICE_COMMANDS) { Log.i -
在C#中执行唤醒单词语音识别的最佳方法是什么
我知道如何使它触发不同的短语,但是我想让一个SpeechRecognitionEngine监听一个唤醒词(例如:trigger),