首页 / PYTHON / python-scrapy错误：exceptions.IOError：无法识别图像文件

python-scrapy错误：exceptions.IOError：无法识别图像文件

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-scrapy错误：exceptions.IOError：无法识别图像文件，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2602字，纯文字阅读大概需要4分钟。

内容图文

python-scrapy错误：exceptions.IOError：无法识别图像文件

我多次收到以下错误,却不知道图像文件名或跟踪它的响应URL：

2012-08-20 08:14:34+0000 [spider] Unhandled Error
Traceback (most recent call last):
  File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 545, in _runCallbacks
    current.result = callback(current.result, *args, **kw)
  File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 362, in callback
    self._startRunCallbacks(result)
  File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 458, in _startRunCallbacks
    self._runCallbacks()
  File "/usr/lib/python2.7/dist-packages/twisted/internet/defer.py", line 545, in _runCallbacks
    current.result = callback(current.result, *args, **kw)
--- <exception caught here> ---
  File "/usr/lib/pymodules/python2.7/scrapy/contrib/pipeline/images.py", line 204, in media_downloaded
    checksum = self.image_downloaded(response, request, info)
  File "/usr/lib/pymodules/python2.7/scrapy/contrib/pipeline/images.py", line 252, in image_downloaded
    for key, image, buf in self.get_images(response, request, info):
  File "/usr/lib/pymodules/python2.7/scrapy/contrib/pipeline/images.py", line 261, in get_images
    orig_image = Image.open(StringIO(response.body))
  File "/usr/lib/python2.7/dist-packages/PIL/Image.py", line 1980, in open
    raise IOError("cannot identify image file")
exceptions.IOError: cannot identify image file

那么,我该如何解决这个问题？导致它在我已经在settings.py中定义的特定数量的错误后停止了我的蜘蛛

解决方法:

冒犯的行使用PIL到scrapy.contrib.pipelines.images.ImagesPipeline中的Image.open()：

def get_images(self, response, request, info):
    key = self.image_key(request.url)
    orig_image = Image.open(StringIO(response.body))

media_downloaded()中的try块捕获了此问题,但自身发出错误：

except Exception:
    log.err(spider=info.spider)

您可以使用以下方法破解此文件：

try:
    key = self.image_key(request.url)
    checksum = self.image_downloaded(response, request, info)
except ImageException, ex:
    log.msg(str(ex), level=log.WARNING, spider=info.spider)
    raise
except IOError, ex:
    log.msg(str(ex), level=log.WARNING, spider=info.spider)
    raise ImageException
except Exception:
    log.err(spider=info.spider)
    raise ImageException

但是更好的选择是创建自己的管道,并在pipelines.py文件中覆盖image_downloaded()方法：

from scrapy import log
from scrapy.contrib.pipeline.images import ImagesPipeline

class BkamImagesPipeline(ImagesPipeline):

    def image_downloaded(self, response, request, info):
        try:
            super(BkamImagesPipeline, self).image_downloaded(response, request, info)
        except IOError, ex:
            log.msg(str(ex), level=log.WARNING, spider=info.spider)

确保在您的设置文件中声明此管道：

ITEM_PIPELINES = [
    'bkam.pipelines.BkamImagesPipeline',
]

内容总结

以上是互联网集市为您收集整理的python-scrapy错误：exceptions.IOError：无法识别图像文件全部内容，希望文章能够帮你解决python-scrapy错误：exceptions.IOError：无法识别图像文件所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/656327.html

来源：【匿名】

【上一篇】python-是否有任何方法可以使用Selenium Webdriver(firefox)记录HTTP请求/响应？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-scrapy错误：exceptions.IOError：无法识别图像文件】教程文章相关的互联网学习教程文章

python 中exception，class学习

python 中exception，class 学习instroduction:Object2 = Object1 ( like java)if Object1 is class object , then copy by reference;if Object1 is basic type, then copy by value1. exception主要结构：try:exception ValueError:exception ZeroDivisionError:exception NameError:exception TypeError:exception:finally:2. custom exceptionclass Error(Exception): passdef MyError(Error): def __init__(self,value): pri...

Python2和Python3中raise Exception【图】

今天写了个记录错误日志的脚本，发现Python3中的raise Exception发生了变化，如下：错误搜了下才知道原来是Python3.6已经不支持这种写法了，所以用了心的方式，如下：正确原文：https://www.cnblogs.com/April-Chou-HelloWorld/p/8836265.html

python handle exception【代码】

1. handle exceptionimport systry:a=1/1 except Exception, e:print"failed", sys.exc_info()[0] else:print"no exception"finally:print"execute final"2. print exceptiontry:raise Exception("aaa","bbb")#a=1/0except Exception as e :print (type(e))print(e.args)print (e) 原文：http://www.cnblogs.com/phoenix13suns/p/3978929.html

关于Python中异常(Exception)

这篇文章介绍的内容是关于关于Python中异常(Exception) ，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下异常是指程序中的例外，违例情况。异常机制是指程序出现错误后，程序的处理方法。当出现错误后，程序的执行流程发生改变，程序的控制权转移到异常处理。下面这篇文章主要汇总了关于Python中异常(Exception)的相关资料，需要的朋友可以参考下。前言Exception类是常用的异常类，该类包括StandardError，StopIte...

详解Python中Exception异常处理

关于异常处理：Python中类定义可以作为对象传递，例子中类B继承了Exception类，在循环中每次raise一个异常类对象B，Except抓到这个异常，循环了3次，所以输出了B B B。例子：class B(Exception): passclass C(B): passclass D(C): passfor cls in [B, C, D]: try: raise cls() except B: print("B") except C: print("C") except D: print("D")执行结果：BBB更多详解Python中Exc...

关于Python中异常(Exception)的汇总

异常是指程序中的例外，违例情况。异常机制是指程序出现错误后，程序的处理方法。当出现错误后，程序的执行流程发生改变，程序的控制权转移到异常处理。下面这篇文章主要汇总了关于Python中异常(Exception)的相关资料，需要的朋友可以参考下。前言Exception类是常用的异常类，该类包括StandardError，StopIteration, GeneratorExit, Warning等异常类。python中的异常使用继承结构创建，可以在异常处理程序中捕获基类异常，也可以捕...

异常(exception)和执行失败有什么区别？

例如一个User Class 的 add 方法，在成功的情况下返回用户对象实例，在失败的情况返回False并可以通过getError方法获取失败原因字符串........说到这里，我好像明白了，难道add方法总是应该返回用户对象，否则抛出异常吗？但是这样的话，他们的代码量没什么区别的啊。问题在于即使调用add方法处没有捕捉异常，该异常也能进一步向上抛出直至被处理或引发进程崩溃？可是说到底，这和程序自然崩溃有什么区别呢？---- 以上为自言自语，...

安装 opencv-python【报错】--【ERROR: Exception: Traceback (most recent call last):】【代码】【图】

使用 pip install opencv-python 命令安装报错：解决方案 1. pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python我依旧报错！！！！ 2 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn opencv-python我依旧报错！！！ 3 解决啦使用豆瓣的链接 pip install opencv-python -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com成功安装！...

python -m onnxsim 报错：RuntimeException: [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION ，UpsampleMode) con【代码】

RuntimeException: [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION : Exception during initialization: /Users/runner/work/1/s/onnxruntime/core/providers/cpu/tensor/upsample.h:271 void onnxruntime::UpsampleBase::ScalesValidation(const std::vector<float> &, const onnxruntime::UpsampleMode) const scale >= 1 was false. Scale value should be greater than or equal to 1.原因是在 torch.onnx.export 的时候没有配置...

Python中使用selenium出现Exception has occurred: WebDriverException【代码】

引言最近自己在开始弄关于Python Spider的内容，就像大家一开始学习一样，都是默默地从环境配置开始。总得来说，这次关于Python Spider的环境配置还是挺快的，基本上没有问题，主要是在这之前就把一些必要的软件给安装好了，例如anaconda，Pycharm，Vscode这些，之后便是导入相关的包，例如selenium和requests这些。如果要学python spider的话，我觉得一般会下一个chromedirver作为工具吧，反正我是这样子做的。下完之后，我自己...

Python - Django - 中间件 process_exception【图】

process_exception(self, request, exception) 函数有两个参数，exception 是视图函数异常产生的 Exception 对象 process_exception 函数的执行顺序是按照 settings.py 中设置的中间件的顺序的倒序执行 process_exception 函数只在视图函数中出现异常的时候才执行，它返回的值可以是 None，也可以是一个 HttpResponse 对象如果返回 None，则继续由下一个中间件的 process_exception 方法来处理异常如果返回 HttpResponse，将调用...

【python】Exception in thread Thread-1:Traceback (most recent call last)

原文链接：https://blog.csdn.net/a519640026/article/details/76157930用多线程和队列解决生产者、消费者问题时程序报错：Exception in thread Thread-1:Traceback (most recent call last)。原因：由于在python 的函数参数中没有加入self导致的。参考例子：|Python 多线程|Queue队列|生产者消费者模式|#!/usr/bin/env python # -*- coding: utf-8 -*-import threading import Queue import random import timeclass Producter(...

返回Exception实例而不是在Python中提升它的缺点是什么？【代码】

我一直在用python-couchdb和desktopcouch做一些工作.在我提交的其中一个补丁中,我从couchdb中包装了db.update函数.对于任何不熟悉python-couchdb的人来说,功能如下：def update(self, documents, **options):"""Perform a bulk update or insertion of the given documents using asingle HTTP request.>>> server = Server('http://localhost:5984/')>>> db = server.create('python-tests')>>> for doc in db.update([... Do...

python异常(高级) Exception【图】

异常(高级) Exception异常回顾:try-except 语句捕获(接收)异常通知,把异常流程变为正常流程try-finally 语句执行必须要执行的语句.raise 语句发送异常通知,同时进入异常流程assert 语句发送AssertionError异常with 语句 with语句语法:with 表达式1 [as 变量1], 表达式2 [as 变量2], ...:语句块作用:使用于对资源进行访问的场合,确保使用过程中不管是否发生异常都会说明:with语句同try-finally语句一样,不会改变程序的状态(异...

python – 为什么我得到了“Exception：(404,u’Not Found’)”和Suds【代码】

我正在尝试使用Suds连接到SugarCRM soap服务(什么是正确的术语？)：from suds.client import Clienturl = "http://localhost/sugarcrm/soap.php?wsdl" client = Client(url) session = client.service.login("usr", "pwd")但是最后一行抛出异常：ERROR:suds.client:<?xml version="1.0" encoding="UTF-8"?> <SOAP-ENV:Envelope xmlns:ns3="http://www.w3.org/2001/XMLSchema" xmlns:SOAP-ENC="http://schemas.xmlsoap.org/soap/enc...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python-scrapy错误：exceptions.IOError：无法识别图像文件

python-scrapy错误：exceptions.IOError：无法识别图像文件

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-scrapy错误：exceptions.IOError：无法识别图像文件】教程文章相关的互联网学习教程文章

python 中exception，class学习

Python2和Python3中raise Exception【图】

python handle exception【代码】

关于Python中异常(Exception)

详解Python中Exception异常处理

关于Python中异常(Exception)的汇总

异常(exception)和执行失败有什么区别？

安装 opencv-python【报错】--【ERROR: Exception: Traceback (most recent call last):】【代码】【图】

python -m onnxsim 报错：RuntimeException: [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION ，UpsampleMode) con【代码】

Python中使用selenium出现Exception has occurred: WebDriverException【代码】

Python - Django - 中间件 process_exception【图】

【python】Exception in thread Thread-1:Traceback (most recent call last)

返回Exception实例而不是在Python中提升它的缺点是什么？【代码】

python异常(高级) Exception【图】

python – 为什么我得到了“Exception：(404,u’Not Found’)”和Suds【代码】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程