以下是我正在研究的排名数据框:
Q6 Q17
1 Consultant NaN
2 Other NaN
3 Data Scientist Java
4 Not employed Python
5 Data Analyst SQL
我要:
- 计算“数据科学家”每种编程语言出现的次数,并在“计数”列中记录频率。
- 按降序对计数进行排序
- 重置索引并将Q17重命名为Language
以下代码未对每种语言进行分组。
ranking_data = ranking_data[ranking_data.Q6 == 'Data Scientist']
ranking_data_summary = ranking_data.copy().rename(columns = {'Q17':'Language'})
ranking_data_summary['counts'] = ranking_data_summary.groupby('Language')
['Language'].transform('count')
ranking_data_summary.sort_values('counts',ascending = False,inplace = True)
ranking_data_summary.reset_index(inplace = True)
我在做什么错了?