我有一些音频文件,它们是成功存储在S3中的客户与代理之间的对话。 我尝试使用AWS transcribe将音频文件转换为文本,并且转换成功。
但是很奇怪的一点是,它的准确度甚至不到60%,这是我为AWS Transcribe进行的配置
1)语言代码-英文(印度)
2)音频-8000HZ
3)格式-WAV
按照本指南(https://docs.aws.amazon.com/transcribe/latest/dg/limits-guidelines.html),
我将音频频率和格式设置为8KHZ,并将格式设置为WAV
我是否需要更改任何其他参数以改善音频质量?
感谢您的帮助。
谢谢,
哈里