Python爬去知乎上问题下所有图片
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Python爬去知乎上问题下所有图片,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1341字,纯文字阅读大概需要2分钟。
内容图文
from zhihu_oauth import ZhihuClient from zhihu_oauth.exception import NeedCaptchaException client = ZhihuClient() try: client.login(‘email_or_phone‘, ‘password‘) print(u"登陆成功!") except NeedCaptchaException: # 保存验证码并提示输入,重新登录 with open(‘a.gif‘, ‘wb‘) as f: f.write(client.get_captcha()) captcha = input(‘please input captcha:‘) client.login(‘+8613872273541‘, ‘z289784552‘, captcha) print(u"登陆成功!") client.save_token(‘token.pkl‘)
from __future__ import print_function # 使用python3的print方法from zhihu_oauth import ZhihuClient import re import os import urllib.request client = ZhihuClient() # 登录 client.load_token(‘token.pkl‘) # 加载token文件 id = 46508954 # https://www.zhihu.com/question/24400664(长得好看是一种怎么样的体验) question = client.question(id) print(u"问题:",question.title) print(u"回答数量:",question.answer_count) os.mkdir(question.title + u"(图片)") path = question.title + u"(图片)" index = 1 # 图片序号for answer in question.answers: content = answer.content # 回答内容 re_compile = re.compile(r‘<img src="(https://pic\d\.zhimg\.com/.*?\.(jpg|png))".*?>‘) img_lists = re.findall(re_compile, content) if (img_lists): for img in img_lists: img_url = img[0] # 图片url urllib.request.urlretrieve(img_url, path + u"/%d.jpg" % index) print(u"成功保存第%d张图片" % index) index += 1
原文:https://www.cnblogs.com/wuyujie/p/9441927.html
内容总结
以上是互联网集市为您收集整理的Python爬去知乎上问题下所有图片全部内容,希望文章能够帮你解决Python爬去知乎上问题下所有图片所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。
来源:【匿名】