如何计算到神经网络Tensorflow Lite的输入以进行语音命令识别?

我一直在遵循本教程来创建TensorFlow Audio Recognition model

接下来,我将此模型转换为tensorflow lite模型(* .tflite),并将其部署到我的NUcleo-l476RG板上。

我的问题是这样的: TensorFlow Lite模型不接收原始音频样本数据。而是使用频谱图,频谱图是由频率信息片组成的二维数组,每个频率信息取自不同的时间窗口。 我找到了计算输入到神经网络的简短描述: Calculating the input to the neural network

我不明白在提出了转换之后,它们如何得到8位数字的数组,以及如果其网络需要40x49的尺寸,为什么尺寸为43x49。

我还使用wav_to_features.py来计算神经网络的输入数据,这很有帮助。但是我不能在我的项目中使用它,我需要用C编写的内容。

也许有人已经遇到过这个问题。也许有人举了一个计算tensorflow lite输入数据以进行语音命令识别的示例。

我将很高兴获得任何帮助。

谢谢。

tmp741852 回答:如何计算到神经网络Tensorflow Lite的输入以进行语音命令识别?

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3108881.html

大家都在问