如何计算到神经网络Tensorflow Lite的输入以进行语音命令识别？

2024-05-17 • 问答

我一直在遵循本教程来创建TensorFlow Audio Recognition model

接下来，我将此模型转换为tensorflow lite模型（* .tflite），并将其部署到我的NUcleo-l476RG板上。

我的问题是这样的： TensorFlow Lite模型不接收原始音频样本数据。而是使用频谱图，频谱图是由频率信息片组成的二维数组，每个频率信息取自不同的时间窗口。我找到了计算输入到神经网络的简短描述： Calculating the input to the neural network

我不明白在提出了转换之后，它们如何得到8位数字的数组，以及如果其网络需要40x49的尺寸，为什么尺寸为43x49。

我还使用wav_to_features.py来计算神经网络的输入数据，这很有帮助。但是我不能在我的项目中使用它，我需要用C编写的内容。

也许有人已经遇到过这个问题。也许有人举了一个计算tensorflow lite输入数据以进行语音命令识别的示例。

我将很高兴获得任何帮助。

谢谢。