我有一个面板数据集,其中包含 19 年(从 2001 年到 2019 年)和 10.344 家公司(例如 X130042)。我已经把我的数据帧变成了长格式(从 ROE_try 到 ROE_long),它包含 NAs 并且它被设置为 pdata.frame (ROE_panel)。 现在我想用 ROE_panel 数据帧中的第 99 个和第 1 个百分位逐年对变量 ROE 的异常值进行 winsorize。
有人可以帮忙吗?提前致谢!
到目前为止我已经尝试过了:
ROE_try <- read.csv2(file.choose(),na = "NA")
ROE_long <- gather(data = ROE_try,key = "company",value = "ROE",-year )
ROE_panel<- pdata.frame(ROE_long,index = c("company","year"))
ROE_panel_w <- winsorize(ROE_panel$ROE,prob = 0.99)
我的数据集如下所示:
year company ROE
X130042-2001 2001 X130042 14.70
X130042-2002 2002 X130042 10.72
X130042-2003 2003 X130042 3.21
X130042-2004 2004 X130042 10.19
X130042-2005 2005 X130042 14.03
X130042-2006 2006 X130042 NA
X130042-2007 2007 X130042 9.82
X130042-2008 2008 X130042 5.52
X130042-2009 2009 X130042 4.29
X130042-2010 2010 X130042 NA
X130042-2011 2011 X130042 4.65
X130042-2012 2012 X130042 4.35
X130042-2013 2013 X130042 2.87
X130042-2014 2014 X130042 5.19
X130042-2015 2015 X130042 0.69
X130042-2016 2016 X130042 6.29
X130042-2017 2017 X130042 15.30
X130042-2018 2018 X130042 -0.96
X130042-2019 2019 X130042 10.14
X130062-2001 2001 X130062 11.18
X130062-2002 2002 X130062 8.20
X130062-2003 2003 X130062 8.46
X130062-2004 2004 X130062 11.32
X130062-2005 2005 X130062 16.56
X130062-2006 2006 X130062 20.22
X130062-2007 2007 X130062 23.89
X130062-2008 2008 X130062 17.91
X130062-2009 2009 X130062 7.07
X130062-2010 2010 X130062 6.88
X130062-2011 2011 X130062 5.77
X130062-2012 2012 X130062 5.96
X130062-2013 2013 X130062 8.20
X130062-2014 2014 X130062 5.26
X130062-2015 2015 X130062 6.84
X130062-2016 2016 X130062 10.34
X130062-2017 2017 X130062 16.13
X130062-2018 2018 X130062 9.75
X130062-2019 2019 X130062 11.87
X130086-2001 2001 X130086 8.29
X130086-2002 2002 X130086 7.64
X130086-2003 2003 X130086 7.03
X130086-2004 2004 X130086 20.82
X130086-2005 2005 X130086 21.75
X130086-2006 2006 X130086 19.59
X130086-2007 2007 X130086 18.37
X130086-2008 2008 X130086 15.96
X130086-2009 2009 X130086 30.20
X130086-2010 2010 X130086 18.15
X130086-2011 2011 X130086 21.44
X130086-2012 2012 X130086 20.19
X130086-2013 2013 X130086 24.00
X130086-2014 2014 X130086 6.31
X130086-2015 2015 X130086 3.33
X130086-2016 2016 X130086 15.70
X130086-2017 2017 X130086 9.91
X130086-2018 2018 X130086 6.49
X130086-2019 2019 X130086 3.94
X130088-2001 2001 X130088 15.33
X130088-2002 2002 X130088 18.95