在python中,Apache Spark RDD是否支持多层列?这是我想要做的:
1)我有一个带有多级列标题(前2行)的csv文件 2)我想在保持多级结构的同时将此数据读入RDD。我可以使用pd.MultiIndex()在熊猫中做到这一点,所以我想知道是否也可以使用RDD。
如果我的问题仍然不清楚,并且您需要更多信息,请告诉我。
在python中,Apache Spark RDD是否支持多层列?这是我想要做的:
1)我有一个带有多级列标题(前2行)的csv文件 2)我想在保持多级结构的同时将此数据读入RDD。我可以使用pd.MultiIndex()在熊猫中做到这一点,所以我想知道是否也可以使用RDD。
如果我的问题仍然不清楚,并且您需要更多信息,请告诉我。