维达辞典结果加起来不等于1.0

我的数据来自Stocktwits的推文,我尝试使用python中的Vader库进行情感分析。 问题在于,正,中性和负字段的总和不等于1.0。取而代之的是,它们总计为2.0。

{'neg':0.0,'neu':2.0,'pos':0.0,'compound':0.0}

这正常吗?

iCMS 回答:维达辞典结果加起来不等于1.0

是的,这很正常。 example in the docs显示相似的结果:

VADER is smart,handsome,and funny.----------------------------- {'pos': 0.746,'compound': 0.8316,'neu': 0.254,'neg': 0.0}
VADER is smart,and funny!----------------------------- {'pos': 0.752,'compound': 0.8439,'neu': 0.248,'neg': 0.0}
...
VADER is not smart,nor funny.------------------------- {'pos': 0.0,'compound': -0.7424,'neu': 0.354,'neg': 0.646}

posneuneg分数是每个类别中文本比例的比率(因此,它们的总和应为1 ...或接近浮动操作)。如果您要对给定句子的情感进行多维测量,这些是最有用的指标。​​

您可能想使用compound得分:

compound得分的计算方法是对词典中每个单词的化合价得分求和,根据规则进行调整,然后归一化为-1(最极端为负)和+1(最极端为正) )。如果您想要给定句子的情感的单维测量,这是最有用的度量。称其为“标准化加权综合得分”是准确的。

它对于希望设置标准化阈值以将句子分为正面,中性或负面的研究人员也很有用。

本文链接:https://www.f2er.com/1924511.html

大家都在问