我试图理解语音识别中的GMM-HMM参数训练。
维特比力对准在训练过程中如何工作?
我目前的假设是,在训练期间,由于电话和观察已知,因此状态路径也已知。这称为维特比力对准吗?一旦知道状态路径,就可以使用Baum-Welch估算参数。是这样吗?
而且,一种状态可以与多个帧相关联,因为电话的发声可以扩展到多个帧。如何训练?我试图理解语音识别中的GMM-HMM参数训练。
维特比力对准在训练过程中如何工作?
我目前的假设是,在训练期间,由于电话和观察已知,因此状态路径也已知。这称为维特比力对准吗?一旦知道状态路径,就可以使用Baum-Welch估算参数。是这样吗?
而且,一种状态可以与多个帧相关联,因为电话的发声可以扩展到多个帧。如何训练?