爬取电影top250 电影名 导演 演员 风格 国家 时长 评分 录入mySQL数据库
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了爬取电影top250 电影名 导演 演员 风格 国家 时长 评分 录入mySQL数据库,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1859字,纯文字阅读大概需要3分钟。
内容图文
![爬取电影top250 电影名 导演 演员 风格 国家 时长 评分 录入mySQL数据库](/upload/InfoBanner/zyjiaocheng/1181/1dfe8acc5a3a421d8ccc1ad43d7459fc.jpg)
import requests
from lxml import etree
import re
import pymysql
import time
conn = pymysql.connect(host=‘localhost‘,user=‘root‘,passwd=‘123456‘,db=‘mydb‘,port=3306,charset=‘urf8‘)
cursor = conn.cursor()
headers = { ‘User-Agent‘:‘Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0)‘ }
def get_movie_url(url):
html = requests.get(url,headers=headers)
selector = etree.HTML(html.text)
movie_hrefs = selector.xpath(‘//div[@class="hd"]/a/@href‘)
for movie_href in movie_hrefs:
get_movie_info(movie_href)
def get_movie_info(url):
html = requests.get(url,headers=headers)
selector = etree.HTML(html.text)
try:
name = selector.xpath(‘//*[@id="content"]/h1/span[1]/text()‘)[0]
director = selector.xpath(‘//*[@id="info"]/span[1]/span[2]/a/text()‘)[0]
actors = selector.xpath(‘//*[@id="info"]/span[3]/span[2]‘)[0]
actor = actors.xpath(‘string(.)‘)
style = re.findall(‘<span property="v:genre">(.*?)</span>‘,html.text,re.S)[0]
country = re.findall(‘<span class="pl">制片国家/地区:</span>(.*?)<br/>‘,html.text,re.S)[0]
release_time = re.findall(‘上映时间:</span>.*?>(.*?)</span>‘,html.text,re.S)[0]
time = re.findall(‘片长:</span>.*?>(.*?)</span>‘,html.text,re.S)[0]
score = selector.xpath(‘//*[@id="interest_sect"]/div[1]/div[2]/strong/text()‘)[0]
cursor.execute("insert into doubanmovie (name,director,actor,style,country,release_time,time,score)values(%s,%s,%s,%s,%s,%s,%s,%s)"(str(name),str(director),str(actor),str(style,str(country),str(release_time),str(time),str(score))))
except IndexError:
pass
if __name__ ==‘__main__‘:
urls = [‘https://movie.douban.com/top250?strart={}‘.format(str(i)) for i in range(0,250,25)]
for url in urls:
get_movie_url(url)
time.sleep(2)
conn.commit()
问题:无法连接数据库 无法检测代码运行
原文:https://www.cnblogs.com/zhentaoFrezt/p/9297857.html
内容总结
以上是互联网集市为您收集整理的爬取电影top250 电影名 导演 演员 风格 国家 时长 评分 录入mySQL数据库全部内容,希望文章能够帮你解决爬取电影top250 电影名 导演 演员 风格 国家 时长 评分 录入mySQL数据库所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。