python写入xml禁止转义问题的解决

这一篇博客以后回头来看可能很肤浅,但为了表示对Stack Overflow贡献者的感谢,顺便记录一下这次解决问题的过程,我还是决定写这篇博文。

以前很讨厌一些博主在写博客前写一堆“无用”的个人感想,但今天我也很想写一下。

好了,先说下我原本要做的需求。简单点讲,我就是要把xml文件中的一些内容修改后保存。但遇到了问题:如果直接调用(Document对象)api里的doc.writexml()函数,碰到xml标签的数据本身有<>尖括号等特殊字符时,会被自动转义成<等字符。

要解决这问题,按惯例我先是百度、谷歌了一遍,没能找到真正符合我使用场景的文章。那就先看看源码吧。发现这是由于minidom的所有内置节点类型在最后写入数据时,都是会调用_write_data()这个函数,这个函数如下:

python写入xml禁止转义问题-问题根源.png

所以,符号被转义的原因一目了然。

而且发现这个函数最终的一个写入操作是直接使用外部的文件写入对象的write方法写入的,于是我想尝试直接用外部open函数创建的写入对象(fw)反过来调用看能不能解决问题:

with open("/path.xls", 'w') as fw: fw.write(doc.toxml()))

但是发现toxml方法最终也还是会调用到每个子节点的writexml()方法,最终还是会调用上边截图的方法。虽然有别的方法可以直接把一个xml文件的内容从磁盘路径中读取出来,但我这个文件对象是在内存中修改后需要保存的,那种从磁盘读取的方式就很可惜了,用不了。然后发现doc实在是没有别的方法可以直接获取到整个文件的内容。毕竟它最终都要用到子节点的实现来读取内容,这也是python的dom解析xml为什么轻量的原因吧?它在需要读取内存数据时都是用了sax2解析器来解析。想到这,我放弃了查找能直接获取xml全部内容进行写入新文件这种方法了。当然也想过换一个库来实现等等。但是代价又太大了,而且python有使用比较普遍的也就sax、dom和elementtree外加几个有其它用途的库。这些库不说能不能解决这个问题,就是换过来也是很麻烦,其它调好的地方还得重新调试。更何况还会有别的问题。在这问题之前也有尝试使用这些库,但api使用不是那么符合我的使用场景,各种问题。

到了这会,如果不想换库的话,又要不用原本的实现,在没有api可以避开原有实现的前提下,我首先想到的是重写方法。于是真正开始使用python的第二天,我开始去搜怎么重写python的函数。正好这时,我在Stack Overflow上看到了一个禁止转义写入的答案,他的思路好像就是这样!但是他的答案没有被采纳。但看在他信誓旦旦地写了一堆代码,最后又各种ok的意思,我仔细看下他的代码,试图从中找点思路也好,看他实现过程,其实就是重写。按照这个思路去实现应该确实是可以的。不知道题主是出于何故,没有采纳他的答案。但既然答主也说可以那还是值得一试的,在看明白他的思路后,我就开始写了。仿照他的实现,我简化了下,因为他的答案考虑到了不是纯string才替换原节点,虽然这样是更合理一点,但我觉得会让我的业务代码增多,不便于维护,我就暂时考虑不管哪种节点,都一概替换成自定义的节点,以后有需求再更改好了。

这里我该附上Stack Overflow的问答链接了:

https://stackoverflow.com/questions/38015864/python-xml-dom-minidom-please-dont-escape-my-strings

在此,再次对答主spky和Stack Overflow平台表示感谢。

而我派生的类是这样:

python写入xml禁止转义问题-自定义节点.png

使用时只要对该标签元素的节点进行替换就可以了:

textNode = RawText() 
textNode.data = xxxxxxxx原始数据 
row.replaceChild(textNode, row.firstChild) 
# row 是从minidom Document对象中取出来的一个Element标签行

最后再正常写入就可以:

..... doc.writexml(fw) 或者 fw.write(doc.toxml())

至此大功告成。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356

推荐阅读更多精彩内容