首页 / PYTHON / Python微信公众号文章爬取，听说这上面很多技术大佬？

Python微信公众号文章爬取，听说这上面很多技术大佬？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python微信公众号文章爬取，听说这上面很多技术大佬？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4085字，纯文字阅读大概需要6分钟。

内容图文

一.思路

我们通过网页版的微信公众平台的图文消息中的超链接获取到我们需要的接口

Python微信公众号文章爬取，听说这上面很多技术大佬？ - 文章图片

从接口中我们可以得到对应的微信公众号和对应的所有微信公众号文章。

二.接口分析

获取微信公众号的接口： https://mp.weixin.qq.com/cgi-bin/searchbiz? 参数： action=search_biz begin=0 count=5 query=公众号名称 token=每个账号对应的token值 lang=zh_CN f=json ajax=1 请求方式： GET 所以这个接口中我们只需要得到token即可，而query则是你需要搜索的公众号，token则可以通过登录后的网页链接获取得到。

Python微信公众号文章爬取，听说这上面很多技术大佬？ - 文章图片

获取对应公众号的文章的接口： https://mp.weixin.qq.com/cgi-bin/appmsg? 参数： action=list_ex begin=0 count=5 fakeid=MjM5NDAwMTA2MA== type=9 query= token=557131216 lang=zh_CN f=json ajax=1 请求方式： GET 在这个接口中我们需要获取的值有上一步的token以及fakeid，而这个fakeid则在第一个接口中可以获取得到。从而我们就可以拿到微信公众号文章的数据了。

Python微信公众号文章爬取，听说这上面很多技术大佬？ - 文章图片

三.实现

第一步：

首先我们需要通过selenium模拟登录，然后获取到cookie和对应的token

def weChat_login(user, password):
    post = {}
    browser = webdriver.Chrome()
    browser.get('https://mp.weixin.qq.com/')
    sleep(3)
    browser.delete_all_cookies()
    sleep(2)
    # 点击切换到账号密码输入
    browser.find_element_by_xpath("//a[@class='login__type__container__select-type']").click()
    sleep(2)
    # 模拟用户点击
    input_user = browser.find_element_by_xpath("//input[@name='account']")
    input_user.send_keys(user)
    input_password = browser.find_element_by_xpath("//input[@name='password']")
    input_password.send_keys(password)
    sleep(2)
    # 点击登录
    browser.find_element_by_xpath("//a[@class='btn_login']").click()
    sleep(2)
    # 微信登录验证
    print('请扫描二维码')
    sleep(20)
    # 刷新当前网页
    browser.get('https://mp.weixin.qq.com/')
    sleep(5)
    # 获取当前网页链接
    url = browser.current_url
    # 获取当前cookie
    cookies = browser.get_cookies()
    for item in cookies:
        post[item['name']] = item['value']
    # 转换为字符串
    cookie_str = json.dumps(post)
    # 存储到本地
    with open('cookie.txt', 'w+', encoding='utf-8') as f:
        f.write(cookie_str)
    print('cookie保存到本地成功')
    # 对当前网页链接进行切片，获取到token
    paramList = url.strip().split('?')[1].split('&')
    # 定义一个字典存储数据
    paramdict = {}
    for item in paramList:
        paramdict[item.split('=')[0]] = item.split('=')[1]
    # 返回token
    return paramdict['token']

定义了一个登录方法，里面的参数为登录的账号和密码，然后定义了一个字典用来存储cookie的值。通过模拟用户输入对应的账号密码并且点击登录，然后会出现一个扫码验证，用登录的微信去扫码即可。
刷新当前网页后，获取当前cookie以及token然后返回。

第二步：

1.请求获取对应公众号接口，取到我们需要的fakeid

    url = 'https://mp.weixin.qq.com'
    headers = {
        'HOST': 'mp.weixin.qq.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36 Edg/86.0.622.63'
    }
    with open('cookie.txt', 'r', encoding='utf-8') as f:
        cookie = f.read()
    cookies = json.loads(cookie)
    resp = requests.get(url=url, headers=headers, cookies=cookies)
    search_url = 'https://mp.weixin.qq.com/cgi-bin/searchbiz?'
    params = {
        'action': 'search_biz',
        'begin': '0',
        'count': '5',
        'query': '搜索的公众号名称',
        'token': token,
        'lang': 'zh_CN',
        'f': 'json',
        'ajax': '1'
    }
    search_resp = requests.get(url=search_url, cookies=cookies, headers=headers, params=params)

将我们获取到的token和cookie传进来，然后通过requests.get请求，获得返回的微信公众号的json数据

lists = search_resp.json().get('list')[0]

通过上面的代码即可获取到对应的公众号数据

fakeid = lists.get('fakeid')

通过上面的代码就可以得到对应的fakeid

2.请求获取微信公众号文章接口，取到我们需要的文章数据

    appmsg_url = 'https://mp.weixin.qq.com/cgi-bin/appmsg?'
    params_data = {
        'action': 'list_ex',
        'begin': '0',
        'count': '5',
        'fakeid': fakeid,
        'type': '9',
        'query': '',
        'token': token,
        'lang': 'zh_CN',
        'f': 'json',
        'ajax': '1'
    }
    appmsg_resp = requests.get(url=appmsg_url, cookies=cookies, headers=headers, params=params_data)

我们传入fakeid和token然后还是调用requests.get请求接口，获得返回的json数据。
我们就实现了对微信公众号文章的爬取。

四.总结

通过对微信公众号文章的爬取，需要掌握selenium和requests的用法，以及如何获取到请求接口。但是需要注意的是当我们循环获取文章时，一定要设置延迟时间，不然账号很容易被封禁，从而得不到返回的数据。

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

内容总结

以上是互联网集市为您收集整理的Python微信公众号文章爬取，听说这上面很多技术大佬？全部内容，希望文章能够帮你解决Python微信公众号文章爬取，听说这上面很多技术大佬？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/619554.html

来源：【匿名】

【上一篇】使用Python做一个简易的选课小程序！大学必备技能！【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python微信公众号文章爬取，听说这上面很多技术大佬？】教程文章相关的互联网学习教程文章

Python 如何操作微信【代码】【图】

1、给文件传输助手发一条消息import itchatitchat.auto_login(enableCmdQR=True) # 这里需要你人工手机扫码登录 itchat.send(‘Hello, 文件助手‘, toUserName=‘filehelper‘)2、回复发给自己的文本消息import itchat@itchat.msg_register(itchat.content.TEXT) def text_replay(msg): return msg.text # 人家说啥你回复啥。。。 itchat.auto_login() itchat.run()3、群发助手import itchat import timeitchat.auto_login(hotRel...

python：发送消息给微信企业号【代码】

1# -*- coding:utf-8 -*- 2 3import requests4import json5 6‘‘‘ 7基础环境：微信企业号8version：python 2.79‘‘‘1011class Send_Message(): 12def__init__(self, text): 13 self.text = text 14def Token(self): 15 url = ‘https://qyapi.weixin.qq.com/cgi-bin/gettoken‘16# corpid,corpsecret 为微信端获取17 params = {‘corpid‘:‘xxxxxxx‘, 18‘corpsecret‘: r‘xxxxxxxxxxx‘19 ...

Python实现微信定时发送天气预报【代码】

schedule实现定时 1import requests2from requests import exceptions3from urllib.request import urlopen4from bs4 import BeautifulSoup5import re6from wxpy import *7import schedule8import time91011 bot=Bot(cache_path=True) #登陆网页微信，并保存登陆状态1213def sendblogmsg(content): 14#搜索自己的好友，注意中文字符前需要+u15 my_friend = bot.friends().search(u‘卿尘‘)[0] 16 my_friend.send(conten...

python 第三方qq登陆搜狗微信搜索

本博文只提供登陆的过程,不提供具体的代码,如果需要源码的请联系qq 516750653.首先你应该对常见的加密算法比较了解,知道即可,还有你需要了解如果使用firebug进行js调试,需要比较熟练,其次你需要有一定阅读js的能力,起码你需要了解点击了某个按钮后将会有那些函数被会执行.1 首先登陆qq, 在登陆qq之前将会进行一次check,其作用是检测你要登陆的账号是否被封,登陆是否需要输入验证码,还有这个check将会从服务器带回一个很重要的参数,...

500行代码，教你用python写个微信飞机大战【代码】【图】

这几天在重温微信小游戏的飞机大战，玩着玩着就在思考人生了，这飞机大战怎么就可以做的那么好，操作简单，简单上手。帮助蹲厕族、YP族、饭圈女孩在无聊之余可以有一样东西让他们振作起来！让他们的左手 / 右手有节奏有韵律的朝着同一个方向来回移动起来！这是史诗级的发明，是浓墨重彩的一笔，是…… 在一阵抽搐后，我结束了游戏，瞬时觉得一切都索然无味，正在我进入贤者模式时，突然想到，如果我可以让更多人已不同的方式体会到...

Python实现获取微信企业号access_token的Class【代码】

微信公众号共有三种，服务号、订阅号、企业号。它们在获取AccessToken上各有不同。其中订阅号比较坑，它的AccessToken是需定时刷新，重复获取将导致上次获取的AccessToken失效。而企业号就比较好，AccessToken有效期同样为7200秒，但有效期内重复获取返回相同结果。为兼容这两种方式，因此按照订阅号的方式处理。处理办法与接口文档中的要求相同：为了保密appsecrect，第三方需要一个access_token获取和刷新的中控服务器。...

python查看删除你微信的账号

#应用环境：python2.7#!/usr/bin/env python# coding=utf-8from __future__ import print_functionimport ostry: from urllib import urlencode, quote_plusexcept ImportError: from urllib.parse import urlencode, quote_plustry: import urllib2 as wdf_urllib from cookielib import CookieJarexcept ImportError: import urllib.request as wdf_urllib from http.cookiejar import CookieJarimport reimpo...

企业微信应用推送消息 python代码 zabbix设置【代码】【图】

企业微信应用推送消息 python代码 wget https://bootstrap.pypa.io/get-pip.py python get-pip.py pip -V pip install requestscat >weixin_send.py <<EOF #!/usr/bin/env python # coding=utf-8import requests import sysdef get_token_in_time(corp_id,secret):res = requests.get(‘https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=%s&corpsecret=%s‘ % (corp_id, secret))res = res.json()token = res.get(‘access_to...

如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例【图】

前几天给大家分享了利用Python网络爬虫抓取微信朋友圈的动态（上）和利用Python网络爬虫爬取微信朋友圈动态——附代码（下），并且对抓取到的数据进行了Python词云和wordart可视化，感兴趣的伙伴可以戳这篇文章：利用Python词云和wordart可视化工具对朋友圈数据进行可视化。今天我们继续focus on微信，不过这次给大家带来的是利用Python网络爬虫抓取微信好友总数量和微信好友男女性别的分布情况。代码实现蛮简单的，具体的教程如下...

用Python玩微信跳一跳详细使用教程

github地址：https://github.com/wangshub/wechat_jump_game工具介绍Python 3Android 手机Adb 驱动Python Matplot绘图python3安装安装pip安装依赖包在github地址将源码下载下来解压后，使用cd命令进入项目目录，执行命令 pip install -r requirements.txt。会将依赖包下载下来。下载好之后执行命令python -m pip list安装adb驱动下载adb驱动进行安装，安装地址：https://adb.clockworkmod.com/同样需要配置好环境变量，配置完环境变...

ZABBIX 微信报警插件（python无图）【代码】

ZABBIX可以实现短信、邮件、微信等各种报警，这三种基本大家都很熟悉，现在基于微信写py，感觉钉钉的团队是从微信出来的，变量都不改，太懒了，说可以实现微信报警苍老师说过：Life is short,you need python!1 微信配置2 程序配置3 ZABBIX配置4 效果展现5 docker环境修改1.1.1 部门设置1.1.2 应用设置1.1.3 权限管理1.1 注册安装3.1 报警媒介类型3.2 配置用户3.3 动作设置1 微信配置微信公众号官网：https://qy.weixin.qq.com/我...

从Python爬虫到SAE云和微信公众号：一、糗事百科爬虫【代码】【图】

这是写给自己玩的练习项目，从糗事百科中爬取段子放到微信公众号上去，这样我就能随时随地的看段子了，啊哈哈哈项目结构1.糗事百科爬虫：Pthon实现，MySQL做持久化存储2.用免费的新浪SAE云搭建微信公众号的服务器3.微信公众号部分主要结构内容划分糗事百科爬虫技术实现：Python2.7插件使用：re,urllib2,pymysql。没有使用beatifulsoap实现思路：1）起始：从糗事百科的“穿越”（http...

python之微信自动发送消息【代码】

代码如下:from__future__import unicode_literals from threading import Timer from wxpy import * import requests bot = Bot() #登录微信def send_news():try:my_friend = bot.friends().search(u‘黑子‘)[0]# 好友的微信号，可以在获取好友列表中找my_friend.send(u"知道吗，你是最最最最美的女孩纸!") #描述自己修改t = Timer(1,send_news)# 设置发送时间间隔 t.start()except:my_friend = bot.friends().search...

2020年python开发微信小程序,公众号,手机购物商城APP【图】

2020年最新的技术全栈,手机短信注册登陆等运用,精准定位用户支付宝支付以及前后端从0到大神的全部精解 2020年最新的技术全栈,手机短信注册登陆等运用, 精准定位用户支付宝支付以及前后端从0到大神的全部精解原文：https://www.cnblogs.com/mahuang/p/12862416.html

python微信八多媒体上传

多媒体上传使用Post方式，这里用到requests第三方包，地址http://cn.python-requests.org/en/latest/user/quickstart.html#id2，上传至site-packages目录，通过浏览器路径得到mediaid。token文件为tokenabc.py见上一节内容。# -*- coding: utf-8 -*- import sae import os import sys root = os.path.dirname(__file__) sys.path.insert(0, os.path.join(root, ‘site-packages‘))import requests import tokenabcdef app(environ...

首页 / PYTHON / Python微信公众号文章爬取，听说这上面很多技术大佬？

Python微信公众号文章爬取，听说这上面很多技术大佬？

内容导读

内容图文

三.实现

第一步：

第二步：

1.请求获取对应公众号接口，取到我们需要的fakeid

2.请求获取微信公众号文章接口，取到我们需要的文章数据

四.总结

内容总结

内容备注

内容手机端

【Python微信公众号文章爬取，听说这上面很多技术大佬？】教程文章相关的互联网学习教程文章

Python 如何操作微信【代码】【图】

python：发送消息给微信企业号【代码】

Python实现微信定时发送天气预报【代码】

python 第三方qq登陆搜狗微信搜索

500行代码，教你用python写个微信飞机大战【代码】【图】

Python实现获取微信企业号access_token的Class【代码】

python查看删除你微信的账号

企业微信应用推送消息 python代码 zabbix设置【代码】【图】

如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例【图】

用Python玩微信跳一跳详细使用教程

ZABBIX 微信报警插件（python无图）【代码】

从Python爬虫到SAE云和微信公众号：一、糗事百科爬虫【代码】【图】

python之微信自动发送消息【代码】

2020年python开发微信小程序,公众号,手机购物商城APP【图】

python微信八多媒体上传

PYTHON - 相关标签

技术 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程