您必须基本上编写一个解析器。解析可以通过基本的字符串操作来完成。然后可以通过pandas to excel之类的库来写入excel文件。
解析:
以下是一些有用的解析提示:
这将使您可以在每个空格处分割文本。例如
>>> "Hello World".split()
['Hello','World']
现在,如果零件始终处于相同的独立位置,则可以通过建立索引来获取它们。
要在单独的列表中获得每一行,您可以执行以下操作:
text = "Your text you read from the file. \n with some \n newlines \n"
lines = text.split("\n")
假设您现在需要第3行的某些内容:
line3 = lines[3]
现在,您可以计算行和空格的索引,并可以创建有关如何获取信息的规则。
带有re的正则表达式:
如果您有可以用正则表达式表示的模式,则可以使用此模块。
例如,您希望所有日期都采用(dd / mm / yy)格式:
>>> import re
>>> text = "19/02/99 or another date 26/12/12 non valid date 12/12/1999"
>>> re.findall(r"[0-9]{2}\/[0-9]{2}\/[0-9]{2}",text)
['19/02/99','26/12/12','12/12/19']
其他有用的功能可能是:search或finditer
评估和测试正则表达式的非常有用的工具是:regex101
如果您还有其他疑问或想要了解有关某个特定主题的更多详细信息,欢迎在评论中提问。
本文链接:https://www.f2er.com/3112063.html