如何使用缺失值对 R 中面板数据集的异常值进行 Winsorize

我有一个面板数据集,其中包含 19 年(从 2001 年到 2019 年)和 10.344 家公司(例如 X130042)。我已经把我的数据帧变成了长格式(从 ROE_try 到 ROE_long),它包含 NAs 并且它被设置为 pdata.frame (ROE_panel)。 现在我想用 ROE_panel 数据帧中的第 99 个和第 1 个百分位逐年对变量 ROE 的异常值进行 winsorize。

有人可以帮忙吗?提前致谢!

到目前为止我已经尝试过了:

ROE_try <- read.csv2(file.choose(),na = "NA")
ROE_long <- gather(data = ROE_try,key = "company",value = "ROE",-year )

ROE_panel<- pdata.frame(ROE_long,index = c("company","year"))

ROE_panel_w <- winsorize(ROE_panel$ROE,prob = 0.99)

我的数据集如下所示:


                 year company     ROE
    X130042-2001 2001 X130042   14.70
    X130042-2002 2002 X130042   10.72
    X130042-2003 2003 X130042    3.21
    X130042-2004 2004 X130042   10.19
    X130042-2005 2005 X130042   14.03
    X130042-2006 2006 X130042      NA
    X130042-2007 2007 X130042    9.82
    X130042-2008 2008 X130042    5.52
    X130042-2009 2009 X130042    4.29
    X130042-2010 2010 X130042      NA
    X130042-2011 2011 X130042    4.65
    X130042-2012 2012 X130042    4.35
    X130042-2013 2013 X130042    2.87
    X130042-2014 2014 X130042    5.19
    X130042-2015 2015 X130042    0.69
    X130042-2016 2016 X130042    6.29
    X130042-2017 2017 X130042   15.30
    X130042-2018 2018 X130042   -0.96
    X130042-2019 2019 X130042   10.14
    X130062-2001 2001 X130062   11.18
    X130062-2002 2002 X130062    8.20
    X130062-2003 2003 X130062    8.46
    X130062-2004 2004 X130062   11.32
    X130062-2005 2005 X130062   16.56
    X130062-2006 2006 X130062   20.22
    X130062-2007 2007 X130062   23.89
    X130062-2008 2008 X130062   17.91
    X130062-2009 2009 X130062    7.07
    X130062-2010 2010 X130062    6.88
    X130062-2011 2011 X130062    5.77
    X130062-2012 2012 X130062    5.96
    X130062-2013 2013 X130062    8.20
    X130062-2014 2014 X130062    5.26
    X130062-2015 2015 X130062    6.84
    X130062-2016 2016 X130062   10.34
    X130062-2017 2017 X130062   16.13
    X130062-2018 2018 X130062    9.75
    X130062-2019 2019 X130062   11.87
    X130086-2001 2001 X130086    8.29
    X130086-2002 2002 X130086    7.64
    X130086-2003 2003 X130086    7.03
    X130086-2004 2004 X130086   20.82
    X130086-2005 2005 X130086   21.75
    X130086-2006 2006 X130086   19.59
    X130086-2007 2007 X130086   18.37
    X130086-2008 2008 X130086   15.96
    X130086-2009 2009 X130086   30.20
    X130086-2010 2010 X130086   18.15
    X130086-2011 2011 X130086   21.44
    X130086-2012 2012 X130086   20.19
    X130086-2013 2013 X130086   24.00
    X130086-2014 2014 X130086    6.31
    X130086-2015 2015 X130086    3.33
    X130086-2016 2016 X130086   15.70
    X130086-2017 2017 X130086    9.91
    X130086-2018 2018 X130086    6.49
    X130086-2019 2019 X130086    3.94
    X130088-2001 2001 X130088   15.33
    X130088-2002 2002 X130088   18.95


wjli44 回答:如何使用缺失值对 R 中面板数据集的异常值进行 Winsorize

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/64937.html

大家都在问