B站路飞学城爬虫教学爬取梨视频

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了B站路飞学城爬虫教学爬取梨视频，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2025字，纯文字阅读大概需要3分钟。

内容图文

import requests
from lxml import etree
import re
import os
from multiprocessing.dummy import Pool
import random

if __name__ == '__main__':
    #创建视频得文件
    if not os.path.exists("./video"):
        os.mkdir("./video")

    url="https://www.pearvideo.com/category_59"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4455.2 Safari/537.36"
    }
    page_text=requests.get(url=url,headers=headers).text
    tree=etree.HTML(page_text)

    li_list=tree.xpath('//*[@id="listvideoList"]/ul/li')
    video_ajax="https://www.pearvideo.com/videoStatus.jsp?"#通过抓包工具获取
    urls = []  # 存储所有视频的链接and名字
    for li in li_list:
        video_id=li.xpath('./div/a/@href')[0]#得到视频id，如video_1727785
        video_num=video_id.split('_')[1]#得到视频id里得数字
        video_name=li.xpath("./div/a/div[2]/text()")[0]+'.mp4'
        params={
            'contId':video_num,
            'mrd':str(random.random())#随机数
        }
        video_headers={
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4455.2 Safari/537.36",
            'Referer': 'https://www.pearvideo.com/' +video_id
        }
        video_dic=requests.get(url=video_ajax,headers=video_headers,params=params).json()
        # print(video_dic)#此时就不会显示下架了，得到含有视频地址得字典

        video_url=video_dic["videoInfo"]["videos"]["srcUrl"]
        # 此处视频地址做了加密即ajax中得到的地址需要加上cont-,并且修改一段数字为id才是真地址
        # 真地址："https://video.pearvideo.com/mp4/third/20201120/cont-1708144-10305425-222728-hd.mp4"
        # 伪地址："https://video.pearvideo.com/mp4/third/20201120/1606132035863-10305425-222728-hd.mp4"
        re_list=re.split('[/-]', video_url)
        re_str=re_list[6]
        video_true_url=video_url.replace(re_str,"cont-"+video_num)
        # print(video_true_url)
        dic={
            "name":video_name,
            "url":video_true_url
        }
        urls.append(dic)

    #使用线程池对视频数进行请求
    def get_video_data(dic):
        url=dic["url"]
        name=dic["name"]
        print(name+"正在下载。。。。。。")
        video_data=requests.get(url=url,headers=headers).content
        with open("./video/"+name,"wb")as fp:
            fp.write(video_data)
            print(name+"下载成功！！！")

    pool=Pool(4)
    pool.map(get_video_data,urls)

    pool.close()
    pool.join()

内容总结

以上是互联网集市为您收集整理的B站路飞学城爬虫教学爬取梨视频全部内容，希望文章能够帮你解决B站路飞学城爬虫教学爬取梨视频所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/998218.html

来源：【匿名】

【上一篇】豆瓣图书信息爬虫【下一篇】PHP使用swoole实现多线程爬虫

更多 ►

【B站路飞学城爬虫教学爬取梨视频】教程文章相关的互联网学习教程文章

以梨视频为例分析页面请求抓取网页数据。本次抓取梨视频生活分类页面下的部分视频数据，并保存到本地。一、分析网页　　打开抓取网页，查看网页代码结构，发现网页结构里面存放视频的地址并不是真正的视频地址。　　　　　　　　　　进入视频详情页面查看后，可以在response中找到真正的视频地址。保存这个地址的并不是标签，而是一个变量，我们使用re来解析这个变量，提取信息。　　　　　　　　二、代码实现"""使用多线程爬取梨...

Python+PyQt5设计B站视频数据爬虫小程序【代码】【图】

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。以下文章来源于菜J学Python ，作者J哥前言目前，市场上有大量 Python图形用户界面（GUI）开发框架可供选择，如wxpython 、pyqt5、Gtk、Tk等。本文将用Python结合PyQt5制作一款B站视频数据爬虫小程序，可以通过输入关键字、页码以及选择存储路径后，下载相应的数据，效果如下：以下将详细介绍这个GUI工具的制作方法，如需本文...

Python爬虫b站视频弹幕并生成词云图分析【代码】【图】

爬虫：requests，beautifulsoup词云：wordcloud，jieba代码加注释： 1# -*- coding: utf-8 -*- 2import xlrd#读取excel 3import xlwt#写入excel 4import requests5import linecache6import wordcloud7import jieba8import matplotlib.pyplot as plt9from bs4 import BeautifulSoup 1011if__name__=="__main__": 12 yun=""1314 n=0#ID编号15 target=‘https://api.bilibili.com/x/v1/dm/list.so?oid=132084205‘#b站oid...

Node 爬虫，批量爬取头条视频并保存【代码】

项目地址：GitHub目标网站：西瓜视频项目功能：下载头条号【维辰财经】下的最新20个视频姊妹项目：批量下载美女图集简介一般批量爬取视频或者图片的套路是，使用爬虫获得文件链接集合，然后通过 writeFile 等方法逐个保存文件。然而，头条的视频，在需要爬取的 html 文件（服务端渲染输出）中，无法捕捉视频链接。视频链接是页面在客户端渲染时，通过某些 js 文件内的算法或者解密方法，根据视频的已知 key 或者 hash 值，动态计算...

Python爬虫人工智能大数据全栈视频史上最全合辑教程分享！【图】

Python爬虫人工智能大数据全栈视频史上最全合辑教程分享！毫无疑问Python是这两年最火的编程语言，不仅容易上手，且在多个行业都可应用。尤其今年人工智能及大数据的发展，Python将会展现更多的实用性！如果你是小白想改变自己的职业方向，抓紧时间上车…精心整理的资料和课程都在下面!Python全栈作为小白，想要快速入门，并且励志做python全栈工程师的话，这个视频课程非常适合入手：获取统一设置在文末，欢迎查阅！大数据、云计算...

Python系列爬虫之下载B站视频【图】

前言之前好像有人问怎么用python下载B站的视频，于是今天稍微研究了一下，发现还是挺简单的，于是过来分享一波。让我们愉快地开始吧~开发工具Python版本：3.6.4相关模块：requests模块；contextlib模块；以及一些Python自带的模块。其他工具：ffmpeg环境搭建同Python批量下载网易云课堂视频。原理简介FLV视频格式(科普一下)：FLV(Flash Video)是Adobe公司设计开发的一种流行的流媒体格式，由于其视频文件体积轻巧、封装简单等特点，...

Python爬虫下载视频文件部分源码【代码】【图】

分享一下我自己整理的代码，改两个参数就可使用（扫描下方二维码获取python学习资料）import requests import time headers = {‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36‘ } movie_url = ‘在这里输入视频地址，例如：http://www.***********.mp4‘ movie_name = ‘视频标题‘ downsize = 0 print(‘开始下载‘) startTi...

如何使用爬虫获取zetv网站中的视频文件？【图】

http://www.zetv.com.cn/play.a... 请问如何获取其中的视频文件回复内容：http://www.zetv.com.cn/play.a... 请问如何获取其中的视频文件我的思路是通过curl获取页面的所有内容，再通过正则匹配出你所需要的内容，再建立下载请求。看了下,这个视频播放使用的rtmp协议 rtmp百科, 通过http是得不到视频的.如果你确实需要下载,也有办法,有一个叫rtmpdump的软件可以下载, http://rtmpdump.mplayerhq.hu/ 试过了,能下载,速度有些慢....

python爬虫可以爬视频吗【图】

网络爬虫又称网络蜘蛛，是指按照某种规则在网络上爬取所需内容的脚本程序。众所周知，每个网页通常包含其他网页的入口，网络爬虫则通过一个网址依次进入其他网址获取所需内容。爬虫结构爬虫调度程序（程序的入口，用于启动整个程序）url管理器（用于管理未爬取得url及已经爬取过的url）网页下载器（用于下载网页内容用于分析）网页解析器（用于解析下载的网页，获取新的url和所需内容）网页输出器（用于把获取到的内容以文件的形式...

Python爬虫爬取视频的详细介绍【图】

本篇文章给大家带来的内容是关于Python爬虫爬取视频的详细介绍，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。最近在写一个应用，需要收集微博上一些热门的视频，像这些小视频一般都来自秒拍，微拍，美拍和新浪视频，而且没有下载的选项，所以只能动脑想想办法了。第一步分析网页源码。例如：http://video.weibo.com/show?fid=1034:0988e59a12e5178acb7f23adc3fe5e97，右键查看源码，一般视频都是mp4后缀，搜...

Python视频爬虫实现下载头条视频【图】

这篇文章主要介绍了Python视频爬虫实现下载头条视频功能,涉及Python正则匹配、网络传输及文件读写等相关操作技巧,需要的朋友可以参考下本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考，具体如下：一、需求分析抓取头条短视频思路：分析网页源码，查找解析出视频资源url（查看源代码，搜mp4）对该url发起请求，返回二进制数据将二进制数据保存为视频格式视频链接：http://video.eastday.com/a/1706121709...

Python编写简单网络爬虫抓取视频【图】

从上一篇文章的评论中看出似乎很多童鞋都比较关注爬虫的源代码。所有本文就使用Python编写简单网络爬虫抓取视频下载资源做了很详细的记录，几乎每一步都介绍给大家，希望对大家能有所帮助我第一次接触爬虫这东西是在今年的5月份，当时写了一个博客搜索引擎，所用到的爬虫也挺智能的，起码比电影来了这个站用到的爬虫水平高多了！回到用Python写爬虫的话题。Python一直是我主要使用的脚本语言，没有之一。Python的语言简洁灵活，标准...

Python实战爬虫视频教程的资料推荐【图】

本套《Python实战爬虫视频教程》是一套很给力的python实战视频教程，对于已经对Python有一定了解和已经掌握Python的朋友想要再进阶一步可以学习本套教程哦！课程播放地址：http://www.gxlcms.com/course/603.html 该老师讲课风格:教师讲课深入浅出，条理清楚，层层剖析，环环相扣，论证严密，结构严谨，用思维的逻辑力量吸引学生的注意力，用理智控制课堂教学进程。学生通过听教师的讲授，不仅学到知识，也受到思维的训练，还受到教...

以视频爬取实例讲解Python爬虫神器BeautifulSoup用法

1.安装BeautifulSoup4 easy_install安装方式,easy_install需要提前安装easy_install beautifulsoup4 pip安装方式,pip也需要提前安装.此外PyPi中还有一个名字是 BeautifulSoup 的包,那是 Beautiful Soup3 的发布版本.在这里不建议安装.pip install beautifulsoup4 Debain或ubuntu安装方式apt-get install Python-bs4 你也可以通过源码安装,下载BS4源码Python setup.py install2.小试牛刀# coding=utf-8 @通过BeautifulSoup下载百度...

使用Python编写简单网络爬虫抓取视频下载资源【图】

我第一次接触爬虫这东西是在今年的5月份，当时写了一个博客搜索引擎，所用到的爬虫也挺智能的，起码比电影来了这个站用到的爬虫水平高多了！回到用Python写爬虫的话题。 Python一直是我主要使用的脚本语言，没有之一。Python的语言简洁灵活，标准库功能强大，平常可以用作计算器，文本编码转换，图片处理，批量下载，批量处理文本等。总之我很喜欢，也越用越上手，这么好用的一个工具，一般人我不告诉他。。。因为其强大的字符串...

首页 / 爬虫 / B站路飞学城爬虫教学爬取梨视频

B站路飞学城爬虫教学爬取梨视频

内容导读

内容图文

内容总结

内容备注

内容手机端

【B站路飞学城爬虫教学爬取梨视频】教程文章相关的互联网学习教程文章

爬虫——使用多进程爬取视频数据【代码】【图】

Python+PyQt5设计B站视频数据爬虫小程序【代码】【图】

Python爬虫b站视频弹幕并生成词云图分析【代码】【图】

Node 爬虫，批量爬取头条视频并保存【代码】

Python爬虫人工智能大数据全栈视频史上最全合辑教程分享！【图】

Python系列爬虫之下载B站视频【图】

Python爬虫下载视频文件部分源码【代码】【图】

如何使用爬虫获取zetv网站中的视频文件？【图】

python爬虫可以爬视频吗【图】

Python爬虫爬取视频的详细介绍【图】

Python视频爬虫实现下载头条视频【图】

Python编写简单网络爬虫抓取视频【图】

Python实战爬虫视频教程的资料推荐【图】

以视频爬取实例讲解Python爬虫神器BeautifulSoup用法

使用Python编写简单网络爬虫抓取视频下载资源【图】

爬虫 - 相关标签

视频 - 相关标签

爬虫 - 最新教程

爬虫 - 最热教程