使用Python从inspect元素中获取代码
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了使用Python从inspect元素中获取代码,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1767字,纯文字阅读大概需要3分钟。
内容图文
![使用Python从inspect元素中获取代码](/upload/InfoBanner/zyjiaocheng/725/e408ccb33ea04575ac7abb64e271ff32.jpg)
在Safari浏览器中,我可以右键单击并选择“Inspect Element”,然后会出现很多代码.是否可以使用Python获取此代码?最好的解决方案是获取包含代码的文件.
更具体地说,我试图找到这个页面上图像的链接:http://500px.com/popular.我可以看到“Inspect Element”中的链接,我想用Python检索它们.
解决方法:
获取网页源代码的一种方法是使用Beautiful Soup library.这个教程显示为here.页面中的代码如下所示,注释是我的.此特定代码不起作用,因为内容在其用作示例的网站上已更改,但该概念应该可以帮助您执行您想要执行的操作.希望能帮助到你.
from bs4 import BeautifulSoup
from urllib2 import urlopen
BASE_URL = "http://www.chicagoreader.com"
def get_category_links(section_url):
# Put the stuff you see when using Inspect Element in a variable called html.
html = urlopen(section_url).read()
# Parse the stuff.
soup = BeautifulSoup(html, "lxml")
# The next two lines will change depending on what you're looking for. This
# line is looking for <dl class="boccat">.
boccat = soup.find("dl", "boccat")
# This line organizes what is found in the above line into a list of
# hrefs (i.e. links).
category_links = [BASE_URL + dd.a["href"] for dd in boccat.findAll("dd")]
return category_links
编辑1:上面的解决方案提供了网络抓取的一般方法,但我同意对该问题的评论. API绝对是这个网站的方式.感谢yuvi提供它.该API于https://github.com/500px/PxMagic提供.
编辑2:有一个关于获取流行照片链接的问题的示例.来自example的Python代码粘贴在下面.您需要安装API库.
import fhp.api.five_hundred_px as f
import fhp.helpers.authentication as authentication
from pprint import pprint
key = authentication.get_consumer_key()
secret = authentication.get_consumer_secret()
client = f.FiveHundredPx(key, secret)
results = client.get_photos(feature='popular')
i = 0
PHOTOS_NEEDED = 2
for photo in results:
pprint(photo)
i += 1
if i == PHOTOS_NEEDED:
break
内容总结
以上是互联网集市为您收集整理的使用Python从inspect元素中获取代码全部内容,希望文章能够帮你解决使用Python从inspect元素中获取代码所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。