如何提高AWS Transcribe中的转录质量

我有一些音频文件,它们是成功存储在S3中的客户与代理之间的对话。 我尝试使用AWS transcribe将音频文件转换为文本,并且转换成功。

但是很奇怪的一点是,它的准确度甚至不到60%,这是我为AWS Transcribe进行的配置

1)语言代码-英文(印度)
2)音频-8000HZ
3)格式-WAV

按照本指南(https://docs.aws.amazon.com/transcribe/latest/dg/limits-guidelines.html),
我将音频频率和格式设置为8KHZ,并将格式设置为WAV 我是否需要更改任何其他参数以改善音频质量?

感谢您的帮助。

谢谢,
哈里

dubujiewu 回答:如何提高AWS Transcribe中的转录质量

许多因素都会影响笔录的质量,例如音频中的背景噪音,说话者重叠,说话者的口音。高质量的音频通常会带来更好的效果。

,

您可以尝试使用自定义词汇表。您可以按照此处https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html

的说明创建这些自定义词汇表

此自定义词汇表应包含一些该领域特定的先前关键词。但是,根据我的经验,这些自定义词汇有时会过拟合(错误地从自定义词汇中输出成绩单中的单词)。

本文链接:https://www.f2er.com/3118486.html

大家都在问