首页 / PYTHON / Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]

Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2320字，纯文字阅读大概需要4分钟。

内容图文

Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]

想用python3内置的urllib库爬一下新闻、文章，结果报错
代码如下:

import urllib.request
import re

url="https://www.csdn.net/"
header=("User-Agent", "Mozilla/5.0")
opr=urllib.request.build_opener()
opr.addheaders=[header]
data=opr.open(url).read()
data=data.decode("utf-8") 

pat='<a href="(https://blog.csdn.net/.*?/article/details/.*?)"' 
allurl=re.compile(pat).findall(data)
'''print(allurl)'''
for i in range(0,len(allurl)):
    try:
        print("这是爬取的第{}个".format(i))
        thisurl=allurl[i]
        file="//Users//liuyuan//Desktop//1234//"+str(i)+".html"
        urllib.request.urlretrieve(thisurl,file)
        print("----成功----")
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

运行上述代码后会报错，具体错误信息如下

urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1056)>

或者

ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1056)

用urllib.request.open(url)只能访问一些http的网站，无法访问https网站
这是由于大部分https的网站需要有SSL证书，即使模拟了User-Agent访问，还是报错，https的安全基础是SSL，如果没有SSL证书，就会拒绝访问。
或者就是此次访问忽略证书验证，查了一下资料，具体实现如下：
需要导入一个模块：

import ssl

然后加入这段代码：

ssl._create_default_https_context = ssl._create_unverified_context

这段代码可以取消证书的验证。
所有代码如下：

import urllib.request
import re
import ssl


ssl._create_default_https_context = ssl._create_unverified_context 
url="https://www.csdn.net/"
headers=("User-Agent", "Mozilla/5.0")
opr=urllib.request.build_opener()
opr.addheaders=[headers]
data=opr.open(url).read()
data=data.decode("utf-8","ignore") 

pat='<a href="(https://blog.csdn.net/.*?/article/details/.*?)"' 
allurl=re.compile(pat).findall(data)
'''print(allurl)'''
for i in range(0,len(allurl)):
    try:
        print("这是第{}次爬取".format(i))
        thisurl=allurl[i]
        file="//Users//liuyuan//Desktop//1234//"+str(i)+".html"
        urllib.request.urlretrieve(thisurl,file)
        print("----成功----")
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

没有做注释，凑合着看吧，都是些简单的代码。
使用的库较简单，如果使用scrapy框架写会省很多麻烦…
应该是个通用的爬取新闻的框架，小爬虫，懒得用框架了

内容总结

以上是互联网集市为您收集整理的Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]全部内容，希望文章能够帮你解决Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/838827.html

来源：【匿名】

【上一篇】Python字符串学习【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]】教程文章相关的互联网学习教程文章

ubuntu上跑python连接pg，报错 ImportError: No module named psycopg2

ubuntu上跑python连接pg，报错 ImportError: No module named psycopg2 root@pgproxy1:~# python /home/zxw/PGWriterTest_m.py Traceback (most recent call last): File "/home/zxw/PGWriterTest_m.py", line 4, in <module> import psycopg2 ImportError: No module named psycopg2 例如以下安装： 1 root@pgproxy1:~# apt-cache search psycopg2 python-psycopg2 - Python module for PostgreSQL python-psycopg2-dbg -...

安装Python3.6.2报错：zipimport.ZipImportError: can't decompress data; zlib not available

解决方法：1、安装依赖zlib、zlib-devel2、重新编译安装Python ./configure 重新编译安装：make & make install; zlib not available' ref='nofollow'>安装Python3.6.2报错：zipimport.ZipImportError: can't decompress data; zlib not available原文：http://www.cnblogs.com/ltz150/p/7228525.html

python使用scipy.misc import imread报错：ImportError: cannot import name imread【代码】

查看scipy.misc帮助文件得知，imread依赖于pillow，所以首先尝试安装pillow：sudo pip3 install pillow若继续报错，则是scipy版本不兼容的问题，需要降级到1.2.1版本pip install scipy==1.2.1 原文：https://www.cnblogs.com/wind-chaser/p/11624648.html

解决 python用 xlsxwrite 向excel 中写入中文字符串变量报错【代码】

问题： UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe7 in position 7: ordinal not in range(128)分析：在网上查找，原来python的str默认是ascii编码，和unicode编码冲突，所以无法中文字符串变量写入excel。解决：在代码中加入下面几行就可以了。import sys reload(sys) sys.setdefaultencoding(‘utf8‘)原文：http://hunkz.blog.51cto.com/6157447/1697345

python 加载excel报错

from pandas import Series, DataFrameimport pandas as pdimport numpy as npimport osimport sysreload(sys)sys.setdefultencoding(‘utf-8‘)file1=pd.read_excel(‘F:/dataanalysis/statistics/PelicanStores.xlsx‘)Python 加载excel报错：IndexError: list index out of range原因是PelicanStores.xlsx 的格式有问题，有未显示的多余列。用excle打开文件PelicanStores.xlsx, 把内容复制到一个新的excel-PelicanStoresnew即可...

Python 报错 AttributeError: module 'django.db.models' has no attribute 'SubfieldBase'

AttributeError: module ‘django.db.models‘ has no attribute ‘SubfieldBase‘ http://www.guanggua.com/question/35166085-How-to-deal-with-SubfieldBase-has-been-deprecated-Use-Fieldfrom_db_value-instead.html说的很详细，后期会整理' has no attribute 'SubfieldBase'' ref='nofollow'>Python 报错 AttributeError: module 'django.db.models' has no attribute 'SubfieldBase'原文：https://www.cnblogs.com/yun1108/...

python3.7中SQLAlchemy安装失败，报错Command errored out with exit status 1

简介：　　SQLAlchemy 是Pychon社区最知名的ORM工具之一，为高效和高性能的数据库访问设计，实现了完整的企业级模型。　　它可以搭配在任何一个python的web框架上，其中比较出名的就是flask 安装过程：（sqlalchemy依赖了PyMySQL 包。）第一步：安装 pymysql　　　　pip install PyMySQL (可能会出现超时，尝试更换镜像，或者多试几次)第二步：安装sqlalchemy pip install sqlalchemy (可能会出现超时...

Linux安装mysql-python库时报错解决办法【代码】

用pip安装mysql-python库的时候遇到如下报错root@LoidAir:~# pip install mysql-python Collecting mysql-pythonUsing cached MySQL-python-1.2.5.zipComplete output from command python setup.py egg_info:sh: 1: mysql_config: not foundTraceback (most recent call last):File "<string>", line 1, in <module>File "/tmp/pip-build-eLhjoy/mysql-python/setup.py", line 17, in <module>metadata, options = get_config()Fi...

【Python】关于键盘键入值、str的与或非问题？【报错：TypeError: unsupported operand type(s) for |: 'str' and 'str'】【代码】

参考【报错：TypeError: unsupported operand type(s) for |: ‘str‘ and ‘str‘】　　在进行键入值比较的时候，想要用“或”运算符对比较结果进行或运算作为 if语句的判断条件。　　结果报错了，说“这个或运算符号 ‘’|‘’ 不能用在‘str‘ 类型之间”？？？？WTF？ctnue = raw_input(‘Do you want to check the next one? T/F :‘) # 屏显为如下所示：并且键入了字符“T” # Do you want to check the next o...

python 安装 reportlab 报错 “ImportError: No module named reportlab.lib”【代码】

reportlab是什么？是一个处理PDF和画图的python开源库．　初次安装：pip install reportlab重新安装：pip install --upgrade --force-reinstall reportlab卸载：pip uninstall reportlab 参考文档：１．　https://stackoverflow.com/questions/38711221/installation-reportlab-importerror-no-module-named-reportlab-lib２．　https://pypi.org/project/reportlab/原文：https://www.cnblogs.com/dylancao/p/10098602.html

Centos 7 python 编译报错 ImportError: No module named six 解决办法【代码】

本地编译Open vSwitch时报错Traceback (most recent call last): File "./ovsdb/ovsdb-idlc.in", line 8, in <module> import ovs.json File "/root/rpmbuild/BUILD/openvswitch-2.6.0/python/ovs/json.py", line 21, in <module> import six ImportError: No module named six Traceback (most recent call last): File "./ovsdb/ovsdb-idlc.in", line 8, in <module> import ovs.json File "/root/rpmbuild/...

Python2爬虫获取的数据存储到MySQL中时报错"Incorrect string value: '\\xE6\\x96\\xB0\\xE9\\x97\\xBB' for column 'new' at row 1"的解决办法

由于一直使用python3进行编码，在使用Python2时，将爬虫数据连接数据库进行存储时，出现如上的报错，经查资料是数据库编码问题。如下转自：http://www.cnblogs.com/liuzhixin/p/6274821.html 的博客，在此感谢博主的慷慨分享之情。错误原因：我们可以看到错误提示中的字符0xF0 0x9F 0x98 0x84 ，这对应UTF-8编码格式中的4字节编码（UTF-8编码规范）。正常的汉字一般不会超过3个字节，为什么为出现4个字节呢？实际上是它对应的是...

安装TA-Lib时报错：ubuntu****, Command "/usr/bin/python -u -c "import setuptools, tokenize;file='【代码】

使用pip install TA-Lib 时报错： ERROR: Complete output from command /usr/bin/python3 -u -c ‘import setuptools, tokenize;__file__=‘"‘"‘/tmp/pip-install-afeznd8w/TA-Lib/setup.py‘"‘"‘;f=getattr(tokenize, ‘"‘"‘open‘"‘"‘, open)(__file__);code=f.read().replace(‘"‘"‘\r\n‘"‘"‘, ‘"‘"‘\n‘"‘"‘);f.close();exec(compile(code, __file__, ‘"‘"‘exec‘"‘"‘))‘ bdist_wheel -d /tmp/pip-wh...

pip install报错：RuntimeError: Python version >= 3.5 required【代码】

由于pip官方的不作为，现如今python2（以及某些低版本python3）配套的pip，已经没法正常的安装pypi包了。例如需要用到的一套PyCaffe的代码，是基于Python2的，于是用miniconda/anaconda创建了虚拟环境：conda create -n py27 python=2.7然后尝试安装numpy:pip install numpy结果提示：RuntimeError: Python version >= 3.5 required"老子用的是python2.7，谁特么叫你找python3的东西了？傻X！”骂归骂，解决方法还是要找。pip在git...

Python异常报错总结

AssertionError断言语句（assert）失败AttributeError尝试访问未知的对象属性EOFError用户输入文件末尾标志EOF（Ctrl+d）FloatingPointError浮点计算错误GeneratorExitgenerator.close()方法被调用的时候ImportError导入模块失败的时候IndexError索引超出序列的范围KeyError字典中查找一个不存在的关键字KeyboardInterrupt用户输入中断键（Ctrl+c）MemoryError内存溢出（可通过删除对象释放内存）NameError尝试访问一个不存在的变量...

首页 / PYTHON / Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]

Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]

内容导读

内容图文

内容总结

内容备注

内容手机端

【Python3 爬取CSDN文章时报错 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]】教程文章相关的互联网学习教程文章

PYTHON3 - 相关标签

SSL - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程