python中xml格式的转换,供大家参考,具体内容如下
近期在做项目的时候需要将数据进行xml和dict 的转换,这里进行初步的总结
1. 基于DOM.
写入
# 导入
import xml.dom.minidom as minidom
# 创建文档实例
dom = minidom.getDOMImplementation().createDocument(None,'Root',None)
# 获得根节点
root = dom.documentElement
for i in range(5):
# 创建节点
element = dom.createElement('Name')
# 给这个节点添加数据
element.appendChild(dom.createTextNode('default'))
# 设置属性
element.setAttribute('age', str(i))
# 添加到节点
root.appendChild(element)
# 保存文件 相对与原始的写入回自动缩进
with open('own.xml', 'w', encoding='utf-8') as f:
dom.writexml(f, addindent='\t', newl='\n',encoding='utf-8')
# 文档内容
<?xml version="1.0" encoding="utf-8"?>
<Root>
<Name age="0">default</Name>
<Name age="1">default</Name>
<Name age="2">default</Name>
<Name age="3">default</Name>
<Name age="4">default</Name>
</Root>
# ==================================
如果需要将已经写好的xml文件进行缩进处理
可以执行以下代码 root 是获取的根节点
import xml.etree.ElementTree as ET
from xml.dom import minidom
def save_xml(root, filename, indent="\t", newl="\n", encoding="utf-8"):
raw_text = ET.tostring(root)
dom = minidom.parseString(raw_Text)
with open(filename, "w") as f:
dom.writexml(f, indent, newl, encoding)
读取
import xml.etree.ElementTree as ET
from xml.dom import minidom
# 读取文档
dom = minidom.parse("own.xml")
# 获取根节点
root = dom.documentElement
# 按照名称查找字节点, 注意这里 回递归查找所有子节点 所有的子节点: root.childNodes
names = root.getElementsByTagName("Name")
for name in names:
print(name.childNodes[0].nodeValue, end="\t")
# 查询name是否含有属性age
if name.hasAttribute("age"):
# 产看属性age
print(name.getAttribute("age"), end="\t")
print("")
2. 基于ElementTree
写入
# 导入
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET
# 增加换行符
def __indent(elem, level=0):
i = "\n" + level*"\t"
if len(elem):
if not elem.text or not elem.text.strip():
elem.text = i + "\t"
if not elem.tail or not elem.tail.strip():
elem.tail = i
for elem in elem:
__indent(elem, level+1)
if not elem.tail or not elem.tail.strip():
elem.tail = i
else:
if level and (not elem.tail or not elem.tail.strip()):
elem.tail = i
root = ET.Element('Root') # 创建节点
tree = ET.ElementTree(root) # 创建文档
for i in range(5):
element = ET.Element('Name')
element.set('age', str(i))
element.text = 'default'
root.append(element)
__indent(root) # 增加换行符
tree.write('default.xml', encoding='utf-8', xml_declaration=True)
# 文档内容
<?xml version='1.0' encoding='utf-8'?>
<Root>
<Name age="0">default</Name>
<Name age="1">default</Name>
<Name age="2">default</Name>
<Name age="3">default</Name>
<Name age="4">default</Name>
</Root>
读取
# -*- coding:utf-8 -*-
import xml.etree.ElementTree as ET
# 获取文档
tree = ET.parse('default.xml')
# 获取根节点
root = tree.getroot()
# 获取所有子节点 list(root)
# 查找所有子节点(非递归) root.findall("Name") 递归 root.iter("Name")
for node in list(root):
print(node.text, node.tag, node.get('age'))
for node in root.findall('Name'):
print(node.text, node.tag, node.get('age'))
# 输出
default Name 0
default Name 1
default Name 2
default Name 3
default Name 4
default Name 0
default Name 1
default Name 2
default Name 3
default Name 4
使用dicttoxml xmltodict等模块
1、解析xml文件:
使用iterfind寻找节点,获取子节点方法 list(节点),获取节点属性 get(属性名),下一级节点的值findtext
from xml.etree.ElementTree import parse
try:
doc=parse('b.xml')
for item in doc.iterfind('class'):
classname=item.get('a_name')
print("classname=",classname)
for s in list(item):
name=s.findtext('name')
age = s.findtext('age')
sex = s.findtext('sex')
print("name=",name,"age=",age,"sex=",sex)
print("-------------------")
except Exception as e:
print(e)
2、字典转换为xml文件:
使用dicttoxml模块,方法:dicttoxml.dicttoxml(字典数据,根节点名称 custom_root=”)import dicttoxml
from xml.dom.minidom import parseString
import os
d=[20,'name',
{'name':'apple','num':10,'price':23},
{'name': 'pear', 'num': 20, 'price': 18.7},
{'name': 'banana', 'num': 10.5, 'price': 23}]
bxml=dicttoxml.dicttoxml(d,custom_root='fruit')
xml=bxml.decode('utf-8')
print(xml)
dom=parseString(xml)
pxml=dom.toprettyxml(indent=' ')
f=open('fruits.xml','w',encoding='utf-8')
f.write(pxml)
f.close()
3、xml文件转为字典:
使用xmltodict模块 ,方法:xmltodict.parse(xml字符串)
import xmltodict
import pprint
f=open('fruits.xml')
xml=f.read()
d=xmltodict.parse(xml)
pp=pprint.PrettyPrinter(indent=4)
pp.pprint(d)#可以通过d['root']['arg']['#text']来访问节点中的文本值,d['root']['arg']['@p']来访问属性值
f.close()
4、字典转换为json
使用json的dumps方法
import json
data={'name':'bill','company':'huawei','age':30}
jsonstr=json.dumps(data)
print(jsonstr)
5、json转换为字典:
使用json模块的loads函数,传入json字符串,返回该字符串对应的字典
d=json.loads(jsonstr) print(d)
6、json转换为类实例
1)、在指定的类中必须有一个接受字典的构造函数;或指定回调函数json2Product;
2)、使用json的loads方法(json字符串,object_hook=类名或者回调函数名)
import json
class Product:
def __init__(self,d):
self.__dict__=d
def json2Product(d):
return Product(d)
f=open('products.json','r',encoding='utf-8')
strjson=f.read()
products=json.loads(strjson,object_hook=Product)
for p in products:
print('name=',p.name,'price=',p.price)
7、 类实例转换为json:
1)、指定回调函数(product2Dict)
2)、使用json的dump函数,指定default参数的回调函数import json
def product2Dict(product):
return {
'name': product.name,
'price': product.price,
'count': product.count
}
strJson=json.dumps(products,default=product2Dict)
print(strJson)
8、字典转换为类:
1)、将字典转换为json
2)、json转换为类
import json
data=[{"name": "iPhone9", "price": 9999, "count": 3000}, {"name": "tesila", "price": 800000, "count": 122}]
# 将字典转换为json
jsonstr=json.dumps(data)
class Product:
def __init__(self,d):
self.__dict__=d
def json2Product(d):
return Product(d)
# 将json转换为类
ps=json.loads(jsonstr,object_hook=Product)
for p in ps:
print('name=', p.name, 'price=', p.price)
9、将类转换为字典:
1)、类转换为json,使用json的dumps方法
2)、json转为字典,使用json的loads方法
def product2Dict(product):
return {
'name': product.name,
'price': product.price,
'count': product.count
}
# 将类转换为json
strJson=json.dumps(ps,default=product2Dict)
print(strJson)
d=json.loads(strJson)
print(d)
10、json转xml
1)、先将xml转换为字典
2)、再使用dicttoxml转换为字典
import json
import dicttoxml
f=open('products.json','r',encoding='utf-8')
jsonstr=f.read()
# 将json转换为字典
d=json.loads(jsonstr)
print(d)
# 将字典转换为xml
bxml=dicttoxml.dicttoxml(d,custom_root='fruit')
print(bxml)
11、将xml转换为json
1)、先使用xmltodict转换为字典
2)、再将字典转换为json
import xmltodict
import json
f=open('products.xml','r',encoding='utf-8')
d=f.read()
#先将xml转换为字典
data=xmltodict.parse(d)
print(data)
#再将字典转换为json
strjson=json.dumps(data)
print(strjson)