我正在使用一个包含322,055行和51列的数据框。这是一项家庭作业,我遇到的问题是“删除任何包含超过50%空值的列”。我已经想出了如何通过运行以下代码(将数据集称为df)来查找特定列的空值百分比:
total_cases<-nrow(df)
print(sum(is.na(df$col1)/total_cases)*100)
如何让它遍历数据集中的每一列?我不能对所有51列使用此代码。
我正在使用一个包含322,055行和51列的数据框。这是一项家庭作业,我遇到的问题是“删除任何包含超过50%空值的列”。我已经想出了如何通过运行以下代码(将数据集称为df)来查找特定列的空值百分比:
total_cases<-nrow(df)
print(sum(is.na(df$col1)/total_cases)*100)
如何让它遍历数据集中的每一列?我不能对所有51列使用此代码。