对于一个项目,我正在使用BeautifulSoup抓取我大学的一些表调度数据,然后使用pandas.read_html()将其读取到DataFrame中。但是,数据位于一个大表中,该表使用两个标题从视觉上分为多个表:大学标题(即“工程学院”),然后是每个列的标题(即“课程”,“开始”)。
例如:
工程学
课程|开始|结束| ...
Pandas正确地将标题解析为一个MultiIndex,其中每个索引元组的第一部分是学院,第二部分是列标题。但是,我想要具有单个列索引的多个DataFrame,并由大学分开。我该怎么做?