Python实现抓取网页API的机器信息并导入Excel表格
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Python实现抓取网页API的机器信息并导入Excel表格,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含4108字,纯文字阅读大概需要6分钟。
内容图文
![Python实现抓取网页API的机器信息并导入Excel表格](/upload/InfoBanner/zyjiaocheng/852/a2a9eb4fbe8548fba62372c8333accb6.jpg)
之前在公司处理过18年的所有机器交付进度的信息,要将所有未交付的机器过滤出来并做统一处理,用Python爬下来并写入Excel表格确实是个好办法。
首先介绍一个处理这个问题最笨的办法:用浏览器打开每个季度的剩余未交付的机器列表,挨行复制粘贴到Excel表格里。。然后每处理完一台就删掉记录。。。这种方法对于小学生确实比较好使,也仅限于小学生了。。当然得升级一下。
然后升级版就是:直接request模块爬下来未交付的机器然后复制到表格里。复制这一步当然也能用python的xl*模块实现啊。要不想挨台处理完还要删记录的话就直接cron命令定时抓一下。。。这样是不是就很符合我的懒人气质了。。。
老套路,先上代码吧。
#-*- coding: UTF-8 -*-
import os
import requests
import json
import xlrd
import xlutils
from xlutils.copy import copy
import sys
reload(sys)
sys.setdefaultencoding('utf8')
def get_device_spec(hostname):
url = "http://abc.def.com/url/s"
pa = "_type:server,hostname:"+ hostname
param = {"q":pa}
respone = requests.request("GET", url, params=param)
res = json.loads(respone.text)
server_detail = res["result"]
return server_detail
def write_excel_data(file_name,sheet_num,row,col,value_data):
rbook = xlrd.open_workbook(file_name)
wbook = copy(rbook)
w_sheet = wbook.get_sheet(sheet_num)
w_sheet.write(row,col,value_data)
wbook.save(file_name)
fileName = "8.25_Q3.xlsx"
data = xlrd.open_workbook(fileName)
sheet01 = data.sheets()[0]
sheet01_nrows = sheet01.nrows
sheet01_row = 1
for sheet01_row in range(1,sheet01_nrows):
hostname = sheet01.cell(sheet01_row,0).value
server = get_device_spec(hostname)
try:
write_excel_data(fileName,0,sheet01_row,1,server[0]["manufacturer"])
write_excel_data(fileName,0,sheet01_row,2,server[0]["idc"])
write_excel_data(fileName,0,sheet01_row,3,server[0]["sn"])
write_excel_data(fileName,0,sheet01_row,4,server[0]["rack_location"])
write_excel_data(fileName,0,sheet01_row,5,server[0]["flavor_disk"])
write_excel_data(fileName,0,sheet01_row,6,server[0]["maintain_enddate"])
except Exception as e:
pass
continue
首先先看get_device_spec函数。这个函数使用request模块通过传入的hostname字段去抓取我们公司的机器信息,并做json格式处理并返回server_detail的所有信息。
def get_device_spec(hostname):
url = "http://abc.def.com/url/s"
pa = "_type:server,hostname:"+ hostname
param = {"q":pa}
respone = requests.request("GET", url, params=param)
res = json.loads(respone.text)
server_detail = res["result"]
return server_detail
接下来看write_excel_data函数。这是一个将信息输入到Excel表格的函数。首先打开文件以及对应的sheet,然后将所需要的row,col和valuue_data字段填入表格内,然后保存该文件。
def write_excel_data(file_name,sheet_num,row,col,value_data):
rbook = xlrd.open_workbook(file_name)
wbook = copy(rbook)
w_sheet = wbook.get_sheet(sheet_num)
w_sheet.write(row,col,value_data)
wbook.save(file_name)
这段代码算是主函数了。主要实现的是定义文件名,然后读取文件内的hostname并将其作为实参传入并运行get_device_spce函数,这一步用来获取机器的所有信息;以及过滤出sn,idc等字段作为实参传入write_excel_data函数内,这一步用来将获得的机器参数过滤出自己需要的字段并填入Excel表格内。最后的except是简单做了一个错误判断退出。。防止自己电脑oom。。
fileName = "8.25_Q3.xlsx"
data = xlrd.open_workbook(fileName)
sheet01 = data.sheets()[0]
sheet01_nrows = sheet01.nrows
sheet01_row = 1
for sheet01_row in range(1,sheet01_nrows):
hostname = sheet01.cell(sheet01_row,0).value
server = get_device_spec(hostname)
try:
write_excel_data(fileName,0,sheet01_row,1,server[0]["manufacturer"])
write_excel_data(fileName,0,sheet01_row,2,server[0]["idc"])
write_excel_data(fileName,0,sheet01_row,3,server[0]["sn"])
write_excel_data(fileName,0,sheet01_row,4,server[0]["rack_location"])
write_excel_data(fileName,0,sheet01_row,5,server[0]["flavor_disk"])
write_excel_data(fileName,0,sheet01_row,6,server[0]["maintain_enddate"])
except Exception as e:
pass
continue
最后我是在自己电脑上配置了每天9点定时运行该文件并抓取机器信息保存。然后上班来处理剩余的机器。。
加一个我个人的公众号:运维开发Club。主要向大家分享Linux运维、Python、Go语言以及当下的云计算、容器等知识,欢迎关注!!!
这段代码算是介绍完成了,其中个人任务也有好多未优化的代码。。。包括代码重用啦,还有获取的信息可用量也不是很多。。等等吧。有待大家帮忙指点。
内容总结
以上是互联网集市为您收集整理的Python实现抓取网页API的机器信息并导入Excel表格全部内容,希望文章能够帮你解决Python实现抓取网页API的机器信息并导入Excel表格所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。