从外部源获取XML文档,并非所有源都遵循模式,这使得很难拥有所有相同的结构化XML文件。
第一个选项:使用XML方案语言或XSD
第二个选择:使用Python(ElementTree,Panda)创建XML验证检查器
考虑到文件数量很多,哪个选项会更好,并且我不想每次从新的外部来源获得XMLS时都更改规则?
目标是拥有一个自我可持续的XML验证/检查器
从外部源获取XML文档,并非所有源都遵循模式,这使得很难拥有所有相同的结构化XML文件。
第一个选项:使用XML方案语言或XSD
第二个选择:使用Python(ElementTree,Panda)创建XML验证检查器
考虑到文件数量很多,哪个选项会更好,并且我不想每次从新的外部来源获得XMLS时都更改规则?
目标是拥有一个自我可持续的XML验证/检查器
我会选择lxml and XSD validation。 XSD是一种设计方法,不会以任何语言(python,java等)创建依赖项。
,XML Schema是专门为解决此类问题而发明的,它做得很好。我想不出有什么充分的理由来编写自己的验证器。您可能非常喜欢ElementTree并因此而非常高效,但是它永远做不到XSD那样容易和彻底地完成工作。