维达辞典结果加起来不等于1.0

2024-05-14 • 问答

我的数据来自Stocktwits的推文，我尝试使用python中的Vader库进行情感分析。问题在于，正，中性和负字段的总和不等于1.0。取而代之的是，它们总计为2.0。

{'neg'：0.0，'neu'：2.0，'pos'：0.0，'compound'：0.0}

这正常吗？

是的，这很正常。 example in the docs显示相似的结果：

VADER is smart,handsome,and funny.----------------------------- {'pos': 0.746,'compound': 0.8316,'neu': 0.254,'neg': 0.0}
VADER is smart,and funny!----------------------------- {'pos': 0.752,'compound': 0.8439,'neu': 0.248,'neg': 0.0}
...
VADER is not smart,nor funny.------------------------- {'pos': 0.0,'compound': -0.7424,'neu': 0.354,'neg': 0.646}

pos，neu和neg分数是每个类别中文本比例的比率（因此，它们的总和应为1 ...或接近浮动操作）。如果您要对给定句子的情感进行多维测量，这些是最有用的指标。

您可能想使用compound得分：

compound得分的计算方法是对词典中每个单词的化合价得分求和，根据规则进行调整，然后归一化为-1（最极端为负）和+1（最极端为正））。如果您想要给定句子的情感的单维测量，这是最有用的度量。称其为“标准化加权综合得分”是准确的。

它对于希望设置标准化阈值以将句子分为正面，中性或负面的研究人员也很有用。

维达辞典结果加起来不等于1.0

iCMS 回答：维达辞典结果加起来不等于1.0

大家都在问