掌握XML DOM，Python解析实例全解析

XML（eXtensible Markup Language）是一种用于存储和传输数据的标记语言，DOM（Document Object Model）是一种用于操作XML和HTML文档的对象模型。在Python中，可以使用xml.etree.ElementTree模块来解析XML文件，并使用DOM模型来操作这些数据。

1. XML基础

在开始解析之前，我们需要了解一些XML的基本概念：

元素：XML中的标记。
属性：附加在元素上的信息。
文本：元素内的文本内容。

例如，以下是一个简单的XML文档：

<note> <to>George</to> <from>John</from> <heading>Reminder</heading> <body>Don't forget the meeting!</body> </note>

2. 使用Python解析XML

Python的xml.etree.ElementTree模块提供了简单而强大的XML解析功能。

2.1. 加载XML文档

首先，我们需要加载XML文档。可以使用xml.etree.ElementTree.parse()函数来实现：

import xml.etree.ElementTree as ET tree = ET.parse('example.xml') root = tree.getroot()

2.2. 遍历节点

Element对象代表XML文档中的一个节点。可以使用.find()、.findall()、.iter()等方法来遍历节点。

2.2.1. `.find()`方法

.find()方法查找与指定标签匹配的第一个子节点：

to = root.find('to') print(to.text) # 输出：George

2.2.2. `.findall()`方法

.findall()方法查找所有与指定标签匹配的子节点：

from_nodes = root.findall('from') for node in from_nodes: print(node.text) # 输出：John

2.2.3. `.iter()`方法

.iter()方法可以遍历文档中的所有节点：

for elem in root.iter('from'): print(elem.text)

2.3. 获取属性

可以使用attrib属性来获取元素的属性：

heading = root.find('heading') print(heading.attrib) # 输出：{'level': '1'}

2.4. 修改XML文档

修改XML文档与获取数据类似。首先，找到要修改的节点，然后修改其属性或文本内容：

body = root.find('body') body.text = 'Don't forget the meeting at 10 AM!' tree.write('example_modified.xml')

3. 实例解析

以下是一个完整的实例，展示了如何使用Python解析XML文档：

import xml.etree.ElementTree as ET # 加载XML文档 tree = ET.parse('example.xml') root = tree.getroot() # 遍历节点 to = root.find('to') print(to.text) # 输出：George # 获取属性 heading = root.find('heading') print(heading.attrib) # 输出：{'level': '1'} # 修改XML文档 body = root.find('body') body.text = 'Don't forget the meeting at 10 AM!' tree.write('example_modified.xml')

通过以上步骤，我们可以使用Python和XML DOM来解析和修改XML文档。希望这个全解析能帮助你更好地理解如何使用Python处理XML数据。