Selenium-python下载但文件保存为.part
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Selenium-python下载但文件保存为.part,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2672字,纯文字阅读大概需要4分钟。
内容图文
![Selenium-python下载但文件保存为.part](/upload/InfoBanner/zyjiaocheng/785/0613aa197b224cd1bb81ba5e74d51956.jpg)
我的脚本可以工作,但它将文件保存为.part,尽管对手动下载的文件检查它的大小相同,谢天谢地完成.我无法理解为什么它被保存为部分文件. Sorta不便于我的下一个想法.有没有人知道为什么会这样?这是我的代码……哪个有效……
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
import time
import mechanize
import urllib
from urllib import urlretrieve
fp = webdriver.FirefoxProfile()
fp.set_preference("browser.download.folderList",1)
fp.set_preference("browser.download.manager.showWhenStarting",False)
fp.set_preference("browser.download.dir",'Users/matthewyoung/Downloads')
fp.set_preference("browser.helperApps.neverAsk.saveToDisk","Plain text")
fp.set_preference("browser.download.manager.scanWhenDone",False)
fp.set_preference("browser.download.manager.showAlertOnComplete",True)
fp.set_preference("browser.download.manager.useWindow",False)
fp.set_preference("browser.helperApps.alwaysAsk.force",False)
browser = webdriver.Firefox(firefox_profile=fp)
#browser = webdriver.Firefox() # Get local session of firefox
browser.get("http://vizier.u-strasbg.fr/vizier/surveys.htx") # Load page
assert "VizieR" in browser.title
#p = raw_input('Star name? ')
elem = browser.find_element_by_name('-c') # Find the query box
elem.send_keys('mwc 560' + Keys.RETURN)
time.sleep(0.2) # Let the page load, will be added to the API
elem=browser.find_element_by_name('-out.max')
elem.send_keys('unlimited'+Keys.TAB)
elem2=browser.find_element_by_name('-out.form')
time.sleep(0.5)
elem2.send_keys('; -Separated-Values')
time.sleep(0.5)
elem2.send_keys(Keys.TAB)
elem2.send_keys(Keys.TAB)
time.sleep(0.2)
browser.find_element_by_class_name('data').submit()
time.sleep(3.0)
#df=elem2.send_keys(Keys.SPACE)
#print df
browser.close()
解决方法:
它以.part下载,因为弹出保存为对话窗口出现. Python无法处理弹出窗口.我发现当你尝试在webdriver中设置自定义配置文件的设置时,它不一定有效(例如我能够在selenium中设置自定义配置文件以下载csv而不是pdf).但是,我能够通过在Firefox中创建自定义配置文件来解决我的pdf问题.我对tsv文件不是很有经验,所以我不确定那是什么设置.如果你可以创建一个新的firefox配置文件(按照这里的说明:https://support.mozilla.org/en-US/kb/profile-manager-create-and-remove-firefox-profiles)
您可以尝试将该配置文件设置为默认保存tsv.如果您不知道要进入的确切设置并更改“about:config”,您可以尝试单击弹出窗口上的复选框以始终保存这些类型的文件.
从那里,您将配置文件设置为您创建的自定义配置文件,如下所示:
profile = webdriver.firefox.firefox_profile.FirefoxProfile("/Users/matthewyoung/Library/Application Support/Firefox/Profiles/"YOUR PROFILE NAME")
请记住,您的个人资料名称将首先包含一堆随机字母,因此请按照该路径查找实际的个人资料名称.
内容总结
以上是互联网集市为您收集整理的Selenium-python下载但文件保存为.part全部内容,希望文章能够帮你解决Selenium-python下载但文件保存为.part所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。