我需要什么: 将实时音频从浏览器以WAV格式流式传输到node.js服务器。
听起来很简单-问题:
使用getUserMedia,您可以获得audio/webm
格式的音频流BUT。 node.js服务器连接到语音到文本引擎(deepspeech),该引擎只能处理WAV格式的流。
已生效的项目:
我已经可以录制固定长度的WAV音频Blob(通过RecorderJs),并将完成的录音发送到node.js服务器,并从readFileSync
服务器端获取其流。储存库here(仅适用于母版)。但是我已经没有固定的录音了,我想连续不断地直播音频。
到目前为止,我不确定这是否在node.js或任何现有库的范围内。我研究了ffmpeg,但没有找到一种方法来更改流的编码。我只能用ffmpeg更改固定文件/ blob的编码。
如果有人可以带领我朝正确的方向前进,让我知道从哪里开始,我将不胜感激。