QT开发(四十二)——DOM方式解析XML-xml文件怎么打开

QT开发(四十二)——DOM方式解析XML-xml文件怎么打开

一、DOM简介

1、DOM简介

DOM是Document Object Model的简写,即XML文档对象模型,是由W3C提出的一种处理XML文档的标准接口。

DOM 一次性读入整个XML文档,在内存中构造为一棵树(DOM树)将XML文件表示成一棵树,便于随机访问其中的节点,但消耗内存相对多一些。能够在这棵树上进行导航,比如移动到下一节点或者返回上一节点,也可以对这棵树进行修改,或者是直接将这颗树保存为硬盘上的一个 XML 文件。

2、XML DOM节点

XML 文档中的每个成分都是一个节点,整个文档是一个文档节点,每个XML 标签是一个元素节点,包含在XML元素中的文本是文本节点, 每一个XML属性是一个属性节点,注释属于注释节点。

QT中使用QDomDocument来表示XML文档,QDomElement表示XML文档的元素,QDomProcessingInstruction表示XML处理指令,QDomAttr表示元素的属性,QDomText表示XML文档中的文本数据。所有的DOM节点如处理指令、元素、属性和文本数据等,都使用QDomNode来表示,然后使用对应的 isProcessingInstruction()、isElement()、isAttr()和isText()等函数来判断是否是该类型的节点,如果是,那么就可以使用toProcessingInstruction()、toElement()、toAttr()和toText()等函数转换为具体类型的节点。

文本数据总是存储在文本节点中,元素节点的文本数据是存储在文本节点中的。

二、QDomDocument

1、QDomDocument简介

QDomDocument类用于显示XML文档,是文档树的根节点,提供了对文档数据的主要访问。由于元素、文本节点、注释、说明等不能在文档外部,QDomDocument包含了创建这些对象的工厂函数。

需要解析的XML文档在内部显示为一棵被QDOM其它类访问的对象树。所有的QDOM类只能引用对象树中的对象。一旦或是QDomDocument根节点被删除,DOM树中的所有内部对象将被删除。

元素、文本节点等的创建由QDomDocument类提供的工厂函数完成。使用默认的QDOM类的构造函数只能得到一个不能操作、插入文档的空对象。

QDomDocument类有多个用于创建文档数据的函数,如createElement、createTextNode、createComment、createCDATASection、createProcessingInstruction、createAttribute和createEntityReference。这些函数中的一些支持命名空间的版本。createDocumentFragment函数为了持有文档中的部分内容,对于操作复杂文档是很有用的。

设置文档的整体内容使用setContent()函数。setContent函数通过XML文档和创建显示文档的DOM树来解析文档。

对于较大的XML文档,DOM树会占用较大的内存空间。对于较大的XML文档,使用QXmlStreamReader或QXmlQuery会使更好的解决方案。

2、QDomDocument成员函数

QDomDocument::QDomDocument(const QString &name)

QDomDocument::QDomDocument(const QDomDocumentType &doctype)

QDomDocument::QDomDocument(const QDomDocument &x)

构造函数

QDomAttr QDomDocument::createAttribute(const QString &name)

创建一个能够插入到元素的名为name的新属性

QDomAttr QDomDocument::createAttributeNS(const QString &nsURI, const QString &qName)

创建一个能够插入到元素的支持命名空间的新属性,名字为qName,命名空间为nsURI

QDomCDATASection QDomDocument::createCDATASection(const QString &value)

创建一个能插入文档的值为value的新CDATA段

QDomComment QDomDocument::createComment(const QString &value)

创建一个能插入文档的值为value的新注释

QDomDocumentFragment QDomDocument::createDocumentFragment()

创建一个持有文档部分内容的文档段

QDomElement QDomDocument::createElement(const QString &tagName)

创建一个能插入DOM树的名为tagName的新元素

QDomElement QDomDocument::createElementNS(const QString &nsURI, const QString &qName)

创建一个能插入DOM树的支持命名空间的名为qName的新元素,命名空间为nsURI

QDomEntityReference QDomDocument::createEntityReference(const QString &name)

创建一个能插入文档的名为name的新实体引用

QDomProcessingInstruction QDomDocument::createProcessingInstruction(const QString &target, const QString &data)

创建一个能插入文档的新的说明,设置说明的目标为target,数据为data

QDomText QDomDocument::createTextNode(const QString &value)

创建一个能插入文档树的值为value的新文本节点

QDomDocumentType QDomDocument::doctype() const

返回文档的文档类型

QDomElement QDomDocument::documentElement() const

返回文档的根元素

QDomElement QDomDocument::elementById(const QString &elementId)

返回ID为elementId的元素

QDomNodeList QDomDocument::elementsByTagName(const QString &tagname) const

返回包含tagname文档的所有元素的节点链表

QDomNodeList QDomDocument::elementsByTagNameNS(const QString &nsURI, const QString &localName)

返回包含本地名为localName、命名空间为nsURI的文档的所有元素的节点链表

QDomImplementation QDomDocument::implementation() const

返回QDomImplementation对象

QDomNode QDomDocument::importNode(const QDomNode &importedNode, bool deep)

从另一个文档导入importedNode节点到文档,如果deep为true,导入importedNode节点的子树,否则导入importedNode节点。

QDomNode::NodeType QDomDocument::nodeType() const

返回节点类型

bool QDomDocument::setContent(const QByteArray &data, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从字节数组数据data解析XML文档,并设置为文档的内容

bool QDomDocument::setContent(const QString &text, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从字符串text中读取XML文档,如果成功解析了内容,返回true

bool QDomDocument::setContent(QIODevice *dev, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从设备dev中读取XML文档,如果成功解析了内容,返回true

bool QDomDocument::setContent(QXmlInputSource *source, bool namespaceProcessing, QString *errorMsg = Q_NULLPTR, int *errorLine = Q_NULLPTR, int *errorColumn = Q_NULLPTR)

从QXmlInputSource中读取XML文档,如果成功解析了内容,返回true

QByteArray QDomDocument::toByteArray(int indent = 1) const

返回解析后的文档的文本内容的UTF-8格式的字节数组数据

QString QDomDocument::toString(int indent = 1) const

返回解析后的文档的文本内容

三、QDomElement

1、QDomElement简介

QDomElement表示DOM树中的一个元素节点。元素有一个标签名和0个或多个属性。

2、QDomElement成员函数

QString QDomElement::attribute(const QString &name, const QString &defValue = QString()) const

返回元素的名字为name的属性,如果不存在,返回defValue默认值

QDomAttr QDomElement::attributeNode(const QString &name)

返回元素中名字为name的属性的QDomAttr对象

QDomNamedNodeMap QDomElement::attributes() const

返回元素中所有属性的通过名字访问属性节点的集合

QDomNodeList QDomElement::elementsByTagName(const QString &tagname) const

返回元素名为tagname的元素的所有子节点的前序遍历的节点链表

bool QDomElement::hasAttribute(const QString &name) const

如果元素中有名字为name的属性,返回true

void QDomElement::removeAttribute(const QString &name)

删除元素中名字为name的属性

void QDomElement::setAttribute(const QString &name, const QString &value)

在元素中添加一个名字为name,值为value的属性,如果已经存在,使用value替换值

void QDomElement::setTagName(const QString &name)

设置元素的标签名为name

QString QDomElement::tagName() const

返回元素的标签名

QString QDomElement::text() const

返回元素的文本

四、QDomAttr

QDomAttr表示元素的属性

QString QDomAttr::name() const

返回属性的名字

QDomElement QDomAttr::ownerElement() const

返回属性所属的元素节点

void QDomAttr::setValue(const QString &v)

设置属性的值为v

bool QDomAttr::specified() const

如果属性已经由用户设置,返回true

QString QDomAttr::value() const

返回属性的值

五、DOM方式操作XML文件

DOM方式解析XML文件先打开XML文件,将XML文件整体加载到内存中建立DOM树,对于XML文档的任何操作在内存中的DOM树直接操作,最后保存时将DOM树的所有节点写回XML文档。需要注意的是,通常打开XML文件,将XML文件加载到内存中建立DOM树后,XML文件就可以关闭了。如果要保存改变后的XML文档内容,需要在保存时以清空文件的方式打开XML文件,将改变后DOM树的所有节点写入XML文件即可。

1、读取XML文件

<?xml version="1.0" encoding="UTF-8"?>

<library>

<book time="2013/6/13" id="1">

<title>C++ primer</title>

<author>Stanley Lippman</author>

</book>

<book time="2007/5/25" id="2">

<title>Thinking in Java</title>

<author>Bruce Eckel</author>

</book>

</library>

读取的XML文件的代码如下:

//打开或创建文件
QFile file("test.xml");
if(!file.open(QFile::ReadOnly))
return;

QDomDocument doc;
//设置test.xml到文档
if(!doc.setContent(&file))
{
file.close();
return;
}
file.close();

//返回根节点
QDomElement root=doc.documentElement();
qDebug()<<root.nodeName();
//获得第一个子节点
QDomNode node=root.firstChild();
while(!node.isNull()) //如果节点不空
{
if(node.isElement()) //如果节点是元素
{
//转换为元素
QDomElement e=node.toElement();
qDebug()<<e.tagName()<<" "<<e.attribute("id")<<" "<<e.attribute("time");
QDomNodeList list=e.childNodes();
for(int i=0;i<list.count();i++)
{
QDomNode n=list.at(i);
if(node.isElement())
qDebug()<<n.nodeName()<<":"<<n.toElement().text();
}
}
//下一个兄弟节点
node=node.nextSibling();
}

2、写XML文件

 //打开或创建文件
QFile file("test.xml");
//QIODevice::Truncate表示清空原来的内容
if(!file.open(QFile::WriteOnly|QFile::Truncate))
return;

QDomDocument doc;
//添加处理命令
QDomProcessingInstruction instruction;
instruction=doc.createProcessingInstruction("xml", "version=\"1.0\" encoding=\"UTF-8\"");
doc.appendChild(instruction);
//添加根节点
QDomElement root=doc.createElement("library");
doc.appendChild(root);
//添加第一个子节点及其子元素
QDomElement book=doc.createElement("book");
//方式一:创建属性 其中键值对的值可以是各种类型
book.setAttribute("id",1);
//方式二:创建属性 值必须是字符串
QDomAttr time=doc.createAttribute("time");
time.setValue("2013/6/13");
book.setAttributeNode(time);
QDomElement title=doc.createElement("title"); //创建子元素
QDomText text; //设置括号标签中间的值
text=doc.createTextNode("C++ primer");
book.appendChild(title);
title.appendChild(text);
QDomElement author=doc.createElement("author"); //创建子元素
text=doc.createTextNode("Stanley Lippman");
author.appendChild(text);
book.appendChild(author);
//添加节点book做为根节点的子节点
root.appendChild(book);

//添加第二个子节点及其子元素
book=doc.createElement("book");
book.setAttribute("id",2);
time=doc.createAttribute("time");
time.setValue("2007/5/25");
book.setAttributeNode(time);
title=doc.createElement("title");
text=doc.createTextNode("Thinking in Java");
book.appendChild(title);
title.appendChild(text);
author=doc.createElement("author");
text=doc.createTextNode("Bruce Eckel");
author.appendChild(text);
book.appendChild(author);
root.appendChild(book);

//输出到文件
QTextStream out_stream(&file);
doc.save(out_stream,4); //缩进4格
file.close();

写入XML文件如下:

<?xml version="1.0" encoding="UTF-8"?>

<library>

<book time="2013/6/13" id="1">

<title>C++ primer</title>

<author>Stanley Lippman</author>

</book>

<book time="2007/5/25" id="2">

<title>Thinking in Java</title>

<author>Bruce Eckel</author>

</book>

</library>

3、增加XML文件内容

 //打开文件
QFile file("test.xml");
if(!file.open(QFile::ReadOnly))
return;

//增加一个一级子节点以及元素
QDomDocument doc;
if(!doc.setContent(&file))
{
file.close();
return;
}
file.close();

QDomElement root=doc.documentElement();
QDomElement book=doc.createElement("book");
book.setAttribute("id",3);
book.setAttribute("time","1813/1/27");
QDomElement title=doc.createElement("title");
QDomText text;
text=doc.createTextNode("Pride and Prejudice");
title.appendChild(text);
book.appendChild(title);
QDomElement author=doc.createElement("author");
text=doc.createTextNode("Jane Austen");
author.appendChild(text);
book.appendChild(author);
root.appendChild(book);

if(!file.open(QFile::WriteOnly|QFile::Truncate))
return;
//输出到文件
QTextStream out_stream(&file);
doc.save(out_stream,4); //缩进4格
file.close();

4、删除XML文件

//打开文件
QFile file("test.xml");
if(!file.open(QFile::ReadOnly))
return;

//删除一个一级子节点及其元素,外层节点删除内层节点于此相同
QDomDocument doc;
if(!doc.setContent(&file))
{
file.close();
return;
}
file.close();

QDomElement root=doc.documentElement();
QDomNodeList list=doc.elementsByTagName("book"); //由标签名定位
for(int i=0;i<list.count();i++)
{
QDomElement e=list.at(i).toElement();
if(e.attribute("time")=="2007/5/25")
root.removeChild(list.at(i));
}

if(!file.open(QFile::WriteOnly|QFile::Truncate))
return;
//输出到文件
QTextStream out_stream(&file);
doc.save(out_stream,4); //缩进4格
file.close();

5、修改XML文件

//打开文件
QFile file("test.xml");
if(!file.open(QFile::ReadOnly))
return;

//更新一个标签项,如果知道xml的结构,直接定位到那个标签上定点更新
//或者用遍历的方法去匹配tagname或者attribut,value来更新
QDomDocument doc;
if(!doc.setContent(&file))
{
file.close();
return;
}
file.close();

QDomElement root=doc.documentElement();
QDomNodeList list=root.elementsByTagName("book");
QDomNode node=list.at(list.size()-1).firstChild();
QDomNode oldnode=node.firstChild();
node.firstChild().setNodeValue("Emma");
QDomNode newnode=node.firstChild();
node.replaceChild(newnode,oldnode);

if(!file.open(QFile::WriteOnly|QFile::Truncate))
return;
//输出到文件
QTextStream out_stream(&file);
doc.save(out_stream,4); //缩进4格
file.close();

推荐阅读