NSXMLParser遇到的坑

因为项目要解析HTML文件,再HTML文件转换一下子,在TextView中展示,相当于做一个小型的浏览器了..
将AttributeString转换为HTML文件输出.
将HTML文件转换为AttributeString输入.
HTML输入需要用NSXMLParser进行解析.
但是问题来了!
NSXMLParser不能解析nbsp;和copy;这种特殊符号,google了一下,说是在HTML文件的第一行加上

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE naughtyxml [
    <!ENTITY nbsp " ">
    <!ENTITY copy "©">
]>

或者

<?xml version="1.0"?>
<!DOCTYPE data PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

这样虽然NSXMLParser代理方法不报错了,不过它貌似没提供代理方法说那个地方出现了这种符号.

走投无路还是选择了OCGumbo,谷歌的这个开源库.
亚哈雷HTML解析就得交给HTML解析框架去做啊.

方法二

可以先读HTML,然后批量替换这些特殊字符,nbsp,copy啊什么的,都替换正确了.然后再用XMLParser扫描.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,027评论 19 139
  • 站在前辈的肩膀上前行 UIKit框架和Foundation框架 所有的Mac OS X和IOS程序都是由大量的对象...
    zysmoon阅读 8,763评论 0 16
  • 在网络开发中,从服务器获取的二进制数据包括: > html > 图片 > 视频 > 音频 > zip 等 除了以上...
    方圆十里不留母狗阅读 805评论 0 0
  • *面试心声:其实这些题本人都没怎么背,但是在上海 两周半 面了大约10家 收到差不多3个offer,总结起来就是把...
    Dove_iOS阅读 27,220评论 30 472
  • 我陷入我吻出的漩涡,这漩涡在你身上搜刮 天地都被席卷进去,花草鸟兽 都被吞噬 我与我身后的世界 都在你的唇上颤抖 ...
    鲸香阅读 355评论 0 0