scrapy报错集锦(持续更新)

报错1

xpath语句:

contents = response.xpath("(//div[@id='article_content']/text()) | (//div[@id='article_content']/br) | (//div[@id='article_content']/p/img)").extract()

报错:

ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

解决办法:

contents = response.xpath(u"(//div[@id='article_content']/text()) | (//div[@id='article_content']/br)|(//div[@id='article_content']/p/img)").extract()
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 序言第1章 Scrapy介绍第2章 理解HTML和XPath第3章 爬虫基础第4章 从Scrapy到移动应用第5章...
    SeanCheney阅读 15,194评论 13 61
  • 每天拖着疲惫的身子,就着夜色回到一个人的空房子,吃着难以下咽的饭菜,一句话也没有,玩着手机,空荡的房间里只有我吃饭...
    人情味9573阅读 287评论 0 0
  • 自己付出的跟所收获的不成正比的时候往往是心理落差最大的时刻,我深知是自己太较真了。他们无所谓,你又何必呢?静心,有...
    Anna_1168阅读 157评论 0 0
  • 在网上了解“华德福教育”的时候翻到文章,觉得文章很客观,贴近普通妈妈的视角。看后对两种名声显赫的教育理念都有一些具...
    青春的李香香阅读 4,524评论 0 12
  • 我看的第一本东野圭吾的小说,故事很温柔治愈。朋友都说选这一本口味太清淡了,有的说他江郎才尽。 想起上月在葭南茶...
    Corey_Lu阅读 207评论 0 1