为什么Jupyter使用列的值来填充列名？

2024-05-19 • 问答

我正在使用SPSS .sav文件，该文件具有典型的列名，如名称，类型，宽度等。 “名称”列标记了m1，I1，I2等行。

import pandas as pd
df = pd.read_spss('./Data.sav')
df.head()

如您所见，列名称是“名称”的条目： https://imgur.com/ZVMS0F0 即，不是使用“名称”，“类型”，“宽度”作为列名，而是使用“名称”的值：m1，I1，I2等。

我对Jupyter和SPSS还是陌生的，不知道从哪里开始。

编辑：按照Rahul Singh的建议，我添加了header=None，尽管read_spss（）似乎无法识别该参数。

import pandas as pd
df = pd.read_spss('./Data.sav',header=None)
df.head()
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-39-77d006c914c9> in <module>
      1 import pandas as pd
----> 2 df = pd.read_spss('./Data_ANQAR_Wave39.sav',header=None)
      3 df.head()

TypeError: read_spss() got an unexpected keyword argument 'header'

`

Usually when you read data from any file(.csv,.txt etc) and header (column names) is is not available in it then pandas will automaticly take first row as header. To get rid of this problem you can provide `header=None`

import savReaderWriter import numpy as np import pandas as pd # Convert .sav file into .csv reader_np = savReaderWriter.SavReaderNp("Data.sav") array = reader_np.to_structured_array("outfile.dat") np.savetxt("Data.csv",array,delimiter=",") reader_np.close() # Read .csv file without header df = pd.read_spss("Data.csv",header=None) df.head()

为什么Jupyter使用列的值来填充列名？

hzhz020261 回答：为什么Jupyter使用列的值来填充列名？

大家都在问