我正在使用 Pandas 并且我有每个单元格只有一个值的列和每个单元格有多个(逗号分隔)值的列。
i1 | e1 |
---|---|
政府拨款,私人拨款... | 政府补助、政府贷款 |
政府拨款,私人拨款... | 政府补助、政府贷款 |
政府拨款,私人拨款... | 政府补助、私人补助... |
来自私营公司或机构的赠款 | 未申请任何资金来源 |
来自私营公司或机构的赠款 | 来自私营部门公司或机构的赠款 |
将值计数应用于每个单元格具有多个值的列时,我使用以下代码:
pd.Series(df['Q3'].str.split(',').sum()).value_counts()
它工作得很好
此外,当我想在每个单元格只有一个值的多个列中执行 value_counts 时,我使用以下代码:
df_singleValueColumnsOnly.apply(pd.Series.value_counts)
它再次正常工作
但是,如果我想对每个单元格具有多个(逗号分隔)值的 2 列进行值计数,我会卡住。