我想离散化一个包含连续变量的列。
数据看起来像;
c(0,25,77,423,6,8,3,65,32,22,10,15,1,2,4,5,6)
我想通过离散化将数字转换为分类数字,但零代表不同的类别。有时直接离散化可以保持不同的数字为零。
我想如果我保留零,然后离散化我的愿望就会实现。但是在数据框列中,由于索引,我无法做到:
这是一个示例 dput()
输出
structure(list(dummy_column = c(0,6)),class = "data.frame",row.names = c(NA,-23L))
例如,如果我想使用 2 个中断,类别应该是;零和其他 3 个离散化的,共 4 个类别。如果我能写一个函数来离散化一个可以直接用 dplyr::mutate()
提前致谢。