我需要对面板数据进行回归分析。我的数据着眼于两个不同观察点(旺季日期和淡季日期)的酒店客房计划价格。
我有this data(仅供参考,这是该问题的简化数据,我的实际数据集包含类似类型的3855个酒店价格观察值和15个其他变量),然后运行:
library(plm)
Y <- cbind(cost)
X <- cbind(deluxe,standard,dinner,cancell,capacity,size)
pdata <- pdata.frame(mydata,index = c("ID_roomplan","season"),drop.index = FALSE)
fixed <- plm(Y ~ X,data = pdata,model = "within")
我得到以下信息:
Warning message:
In pdata.frame(mydata,:
duplicate couples (id-time) in resulting pdata.frame
我知道这是因为需要一对唯一的id时间(即ID_roomplan-season)才能使plm工作,但是我不知道如何解决数据,因为对于不同的价格可以有相同的房间计划在同一季节内,由于选择上的差异(例如,因为一种房间类型可以取消,或一间房间包括晚餐)。
我觉得我有两个选择:
- 通过区分不只是创建新的ID_roomplan类别 房间计划之间还包括虚拟变量选项,例如 标识符,然后进行plm。 或
- 分别针对旺季和淡季进行lm回归模型 而不使用plm。
哪个选项最好,还有其他选择吗?