我一直在尝试了解隐马尔可夫模型,但是遇到了一个问题。 我已经计算出给定模型产生观察序列的概率为:
P(O |λ)=ΣαT(i)
我从劳伦斯·R·拉宾纳(Lawrence R. Rabiner)1989年的论文中得到了这个公式以及我一直在使用的所有公式:https://www.ece.ucsb.edu/Faculty/Rabiner/ece259/Reprints/tutorial%20on%20hmm%20and%20applications.pdf
此外,我阅读了以下文章,其中很好地形象化了HMM的基本知识:https://medium.com/@Ayra_Lux/hidden-markov-models-part-1-the-likelihood-problem-8dd1066a784e
我的问题是,我不了解所产生的概率,因为它随着序列的增加而减小,在我的情况下大约为10 ^ -17,而在上述文章中大约为10 ^ -4。 这是否意味着模型对数据的预测不佳,或者计算出的值与模型的性能成反比?
从我的理解来看,P(O |λ)的低值似乎不受欢迎,但是可能我误解了。
有人可以帮我清理一下吗?
该值在最佳情况下应该在哪个范围内?
谢谢您的回答!
编辑:为了进一步说明这一点,我使用了A和B的序列,其中A后面总是跟着B,反之亦然。
例如:ABABABABABABABABABABABABABABAB
产生的过渡概率应该是: A-> B = 1,A-> A = 0& B-> A = 1,B-> B = 0
HMM使用Baum-Welch-Algorithm快速学习了这些概率。但是,如果我对最后一个时间步的前向概率求和(因此P(O |λ)=ΣαT(i)),则结果值为0或至少非常接近该值。