PythonでElementTreeを使ってXMLファイルを読み込む方法
XMLを扱うにはいくつかのライブラリが用意されていますが、今回はPythonの標準ライブラリにあるElementTreeを使ってXMLファイルを読み込む方法について説明します。
XMLファイルを読み込む
今回は以下のようなsample.xmlを読み込んでみます。
<fruits>
    <item001>apple</item001>
    <item002>orange</item002>
    <item003>banana</item003>
</fruits>
ElementTreeはXMLを操作するためのライブラリで、import文で読み込むことによって利用することができます。
# -*- coding: utf-8 -*-
from xml.etree import ElementTree
x = 'sample.xml'               # 読み込むxmlファイルのパスを変数に記憶させる
tree = ElementTree.parse(x)    # xmlファイルを読み込む
root = tree.getroot()          # ルートを取得する
print root.tag                 # fruit
print root.findtext('item002') # orange
ファイルの読み込みには、ElementTree.parse()を使います。引数には読み込むXMLファイルのパスを指定します。
getroot()を使ってルート要素を取得できます。ルートから辿って、子要素にアクセスすることができます。上のプログラムでは、root.tag()で読み込んだXMLのルートノードのタグ名を表示し、root.findtext()で指定したタグのテキスト内容を表示しています。