<p>Чтение документов XML при помощи интерфейса DOM</p>

DOM является стандартным программным интерфейсом синтаксического анализа документов XML, который разработан Консорциумом всемирной паутины (W3C). Qt обеспечивает уровень 2 интерфейса DOM для чтения, обработки и записи документов XML без проверки их достоверности.

DOM представляет файл XML в памяти в виде дерева. Мы можем просматривать дерево DOM столько раз, сколько нам нужно, и мы можем модифицировать и записывать его на диск в виде файла XML.

Давайте рассмотрим следующий документ XML:

Ars longa vita brevis

Art is long, life is short

Ему соответствует следующее дерево DOM:

Дерево DOM содержит узлы разных типов. Например, узел Element соответствует открывающему тегу и связанному с ним закрывающему тегу. Все, что располагается между этими тегами, представляется в виде дочерних узлов данного элемента Element.

В Qt различные типы таких узлов (как и все другие связанные с DOM классы) имеют префикс QDom. Так, QDomElement представляет узел Element, a QDomText представляет узел Text.

Различные узлы могут иметь дочерние узлы разных типов. Например, узел Element может содержать другие узлы Element, а также узлы EntityReference, Text, CDATASection, ProcessingInstruction и Comment. Рис. 15.3 показывает, какие типы дочерних узлов допустимы для соответствующих родительских узлов. Узлы, показанные серым, не могут иметь дочерних узлов.

Рис. 15.3. Родственные связи между узлами DOM.

Для иллюстрации применения DOM при чтении файлов XML мы напишем парсер для файла предметного указателя книги, описанного в предыдущем разделе.

01 class DomParser

02 {

03 public:

04 DomParser(QIODevice *device, QTreeWidget *tree);

05 private:

06 void parseEntry(const QDomElement &element,

07 QTreeWidgetItem *parent);

08 QTreeWidget *treeWidget;

09 };

Мы определяем класс с названием DomParser, который выполняет синтаксический анализ предметного указателя книги, представленного в виде документа XML, и отображает результат в виджете QTreeWidget. Этот класс не наследует никакой другой класс.

01 DomParser::DomParser(QIODevice *device, QTreeWidget *tree)

02 {

03 treeWidget = tree;

04 QString errorStr;

05 int errorLine;

06 int errorColumn;

07 QDomDocument doc;

08 if (!doc.setContent(device, true, &errorStr,

09 &errorLine, &errorColumn)) {

10 QMessageBox::warning(0, QObject::tr("DOM Parser"),

11 QObject::tr("Parse error at line %1, column %2:\n%3")

12 .arg(errorLine).arg(errorColumn).arg(errorStr));

13 return;

14 }

15 QDomElement root = doc.documentElement();

16 if (root.tagName() != "bookindex")

17 return;

18 QDomNode node = root.firstChild();

19 while (!node.isNull()) {

20 if (node.toElement().tagName() == "entry")

21 parseEntry(node.toElement(), 0);

22 node = node.nextSibling();

23 }

24 }

В конструкторе мы создаем объект QDomDocument и вызываем для него функцию setContent(), чтобы с его помощью прочесть документ XML с устройства QIODevice. Функция setContent() автоматически открывает устройство, если оно еще не открыто. Затем мы вызываем функцию documentElement() для объекта QDomDocument, чтобы получить его одиночный дочерний элемент QDomElement, после чего мы проверяем, является ли данный элемент . Мы выполняем цикл по всем дочерним узлам, и если узлом является элемент , мы вызываем функцию parseEntry() для его синтаксического анализа.

Перейти на страницу:

Похожие книги