首页 / UBUNTU / Ubuntu下的Selenium爬虫的配置

Ubuntu下的Selenium爬虫的配置

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Ubuntu下的Selenium爬虫的配置，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2343字，纯文字阅读大概需要4分钟。

内容图文

　　在服务器Ubuntu系统上跑爬虫，爬虫是基于Selenium写的，遇到好几个问题，现在这里记录一下。

1. 安装环境

　　阿里云，Ubuntu16.04，因为没有界面，所以远程命令行操作。爬虫是基于Selenium写的，需要安装Chrome浏览器和Chromedriver。

　　1.1安装Chrome和Chromedriver

　　　　Chrome直接去官网下载，安装稳定版，https://www.ubuntuupdates.org/ppa/google_chrome?dist=stable，下载deb格式的安装包，上传到服务器，用命令行安装：

            　　　　1
            sudo dpkg -i google-chrome*.deb
　　　　2sudo apt-get install -f

　　　　安装完成使用命令查看Chrome的版本，若出现版本号说明安装成功。

            　　　　1 google-chrome --version

　　　　Chromedriver去淘宝镜像下载，http://npm.taobao.org/mirrors/chromedriver/，下载时选择与Chrome版本对应的Chromedriver，点开里面的notes.txt可以看到对应关系。下载后上传到服务器，或者 wget -N链接下载。下载后解压，若没有安装解压软件，使用下面的命令安装。

            　　　　1
            sudo apt-get installunzip

　　　　将解压后的文件移动到/usr/bin/文件下，添加执行权限。

            　　　　1
            sudo
            mv chromedriver /usr/bin/
　　　　2sudochmod +x /usr/bin/chromedriver

　　1.2 安装Anaconda3

　　　　去清华源下载Anaconda3，https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/，下载后上传到服务器，使用命令安装，此处要注意把Anaconda安装为Linux下多用户共享的软件，避免多个用户重复安装。

            　　　　1
            sudo bash Anaconda3-5.2.0-Linux-x86_64.sh

　　　　安装时有一个步骤是要求你输入安装路径，Linux下多用户共享的软件是在/usr/local目录下，所以填写这个目录。安装最后会提示问你要不要把Anaconda添加到系统路径，选Yes，然后更新root用户的设置（这样做还会避免另一个大坑，下面会讲到）。关闭窗口后生效。

            　　　　1
            sudo source ~/.bashrc

　　　　若已经为root用户安装了Anaconda，建议卸载后重新安装。卸载方法是删除原来的/usr/local/bin下Anaconda的安装目录，编辑root用户的设置文件：

            　　　　1
            sudo vim ~/.bashrc

　　　　把里面原来添加的Anaconda路径设置删除，然后更新一下设置。

            　　　　1
            sudo source ~/.bashrc

　　　　在命令行里输入python，出现的python版本是3.6而不是系统自带的2.7或3.5，说明安装成功。

1.3 安装Selenium

　　　　在root用户下安装：

            　　　　1 pip install selenium

　　　　打开python，输入以下代码，不报错说明安装成功。

            　　　　1
            from selenium import webdriver

　　　　安装到这里就能跑代码了嘛？不，还不行，哈哈哈。

2. 修改配置来执行代码

　　　　Selenium跑不起来，报错。就不截图了，只是说不能正常启动。经过我的搜索，有两个问题会导致这个错误：

　　　　selenium.common.exceptions.WebDriverException: Message: unknown error: Chrome failed to start: exited abnormally (Driver info: chromedriver=........

　　　　1. 当前执行代码的用户是root用户，而root用户打开Chrome需要在沙盒里运行，webdriver里默认关闭了沙盒，所以报错。两种解决方法，为Ubuntu添加一个新用户或者修改代码里的设置。我只实验了第一种，添加了一个新用户，第二种没试。因为root用户只用来管理，新用户用来跑代码，分开不容易出错。

　　　　Ubuntu里添加新用户的方法是在root用户下执行：

            　　　　1
            sudo adduser username

　　　　会让你设置密码。companyname，phone之类的直接enter跳过就行。

　　　　2. 没有界面，所以装一个虚拟界面才行。

　　　　在root用户下安装pyvirtualdisplay:

            　　　　1 pip install pyvirtualdisplay

　　　　然后在代码里添加以下几行，进行测试：

            　　　　1
            from selenium import webdriver
　　　　2from pyvirtualdisplay import Display
　　　　34if__name__ == ‘__main__‘:
　　　　5     display = Display(visible=0, size=(800, 800))
　　　　6    display.start()
　　　　7     browser = webdriver.Chrome()
　　　　8     browser.get(‘http://www.baidu.com‘)
　　　　9print (browser.title)

　　　　大功告成。第一篇博客，嘻嘻。如果还有问题那就是第一步安装的Chrome和Chromedriver版本不匹配导致的，仔细检查一下。

原文：https://www.cnblogs.com/baijing1/p/9751399.html

内容总结

以上是互联网集市为您收集整理的Ubuntu下的Selenium爬虫的配置全部内容，希望文章能够帮你解决Ubuntu下的Selenium爬虫的配置所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1209189.html

来源：【匿名】

【上一篇】用navicat链接不上ubuntu中的mysql服务器【下一篇】Ubuntu环境下swoole扩展安装步骤以及注意事项

更多 ►

【Ubuntu下的Selenium爬虫的配置】教程文章相关的互联网学习教程文章

Ubuntu下的Selenium爬虫的配置【代码】

在服务器Ubuntu系统上跑爬虫，爬虫是基于Selenium写的，遇到好几个问题，现在这里记录一下。1. 安装环境　　阿里云，Ubuntu16.04，因为没有界面，所以远程命令行操作。爬虫是基于Selenium写的，需要安装Chrome浏览器和Chromedriver。　　1.1安装Chrome和Chromedriver　　　　Chrome直接去官网下载，安装稳定版，https://www.ubuntuupdates.org/ppa/google_chrome?dist=stable，下载deb格式的安装包，上传到服务器，用命令行安装：　...

Ubuntu server using selenium【代码】【图】

以下所有的安装都是在Ubunt server 18.04 LTS 64bit服务器版本（命令行无界面版本）下进行，编程语言使用Python3.8.0一、安装Chrome1.首先尝试执行以下命令sudo apt update sudo apt install -y libappindicator1 fonts-liberation wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb sudo dpkg -i google-chrome*.deb如果有报错基本上的原因是因为缺少了一些必要的依赖，执行下面命令：sudo apt -f...

ubuntu配置selenium【代码】

1 安装Chrome wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.debsudo dpkg -i google-chrome-stable_current_amd64.deb 2 安装webdriver 访问https://chromedriver.storage.googleapis.com/index.html 根据版本号下载webdriver 运行以下命令检查Google版本 dpkg -l | grep google安装driver sudo mv chromedriver /usr/bin/chromedriver sudo chown root:root /usr/bin/chromedriver sudo chmod +x...

ubuntu中selenium+chrome截图时中文显示成方框问题的解决方法【代码】

ubuntu中通过selenium+chrome打开浏览器网页截图时，中文部分如果显示为方框，这说明系统中缺少支持的中文字体。解决方法： 1.下载任意一种中文字体，或者直接从windows系统字体文件夹(C:\Windows\Fonts)中选择一种，比如宋体simsun.ttc 2.将该字体文件放入/usr/share/fonts/路径下 3.修改权限sudo chmod 644 /usr/share/fonts/simsun.ttc4.在终端依次执行以下命令，使字体生效sudo mkfontscale sudo mkfontdir sudo fc-cache -fv...

linux – 未知错误：在ubuntu上执行Selenium UI测试用例时,DevToolsActivePort文件不存在错误【代码】

我有一个拥有UI的ubuntu服务器. U可以通过触发mvn test命令来执行测试用例.但问题是,当我从另一台机器通过终端ssh机器时,我得到以下错误 – unknown error: DevToolsActivePort file doesn't exist(Driver info: chromedriver=2.40.565383 (76257d1ab79276b2d53ee976b2c3e3b9f335cde7),platform=Linux 4.4.0-121-generic x86_64) (WARNING: The server did not provide any stacktrace information) Command duration or timeout: ...

Ubuntu18.04下Selenium配置chromedriver和geckodriver【代码】

在flask客户端自动测试，使用工具selenium 时，遇到一个问题。问题：运行selenium 报错，错误如下： selenium.common.exceptions.WebDriverException: Message: 'geckodriver' executable needs to be in PATH.上面是使用的Firefox游览器，如果用Chrome也会提示没有chromedriver 报错是因为我们的环境(path)没有配置好。环境里没有chromedriver 和 geckodriver 解决方法：我电脑的环境：Ubuntu18.04 + Pycharm + Selenium + Ch...

如何解决ubuntu安装selenium时出现错误：Cannot fetch index base URL http://pypi.python.org/simple/【图】

在ubuntu下安装selenium一直失败，快吐血了。如用命令：sudo pip install -U selenium，失败：提示： Downloading/unpacking selenium Cannot fetch index base URL http://pypi.python.org/simple/ Could not find any downloads that satisfy the requirement selenium No distributions at all found for selenium Storing complete log in /home/yanner/.pip/pip.log 查了2天资料，总算找到了解决方法： 1、先确认是否安装了py...

ubuntu18.04 + Firefox + Selenium配置

1.pip3 install selenium 2.在https://github.com/mozilla/geckodriver/releases/ 上下载驱动，注意驱动版本 3.进入下载目录，解压该问价，tar -zcvf geckodriver-v0.24.0-linux64.tar.gz 4.将解压好的文件移动到/usr/local/bin中 mv geckodriver /usr/local/bin 5.测试，有弹出浏览器即可from selenium import webdriverdriver = webdriver.Firefox() driver.close()

SELENIUM - 相关标签

UBUNTU - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...ubuntu如何将 nginx 文档本地化(离线安...ubuntu设置环境变量永久生效 win10系统利用FileZilla向虚拟机（Ubun...ubuntu 设置允许root用户登陆解决ubuntu下mysql的'Access denied fo...如何从Ubuntu 18.04或Ubuntu 19.10升级...ubuntu系统中MysqlERROR1045(28000)报错...ubuntu下使用gdb调试程序（栈溢出）Ubuntu 18.04上搭建FTP服务器

首页 / UBUNTU / Ubuntu下的Selenium爬虫的配置

Ubuntu下的Selenium爬虫的配置

内容导读

内容图文

1. 安装环境

1.1安装Chrome和Chromedriver

1.2 安装Anaconda3

1.3 安装Selenium

2. 修改配置来执行代码

内容总结

内容备注

内容手机端

【Ubuntu下的Selenium爬虫的配置】教程文章相关的互联网学习教程文章

Ubuntu下的Selenium爬虫的配置【代码】

Ubuntu server using selenium【代码】【图】

ubuntu配置selenium【代码】

ubuntu中selenium+chrome截图时中文显示成方框问题的解决方法【代码】

linux – 未知错误：在ubuntu上执行Selenium UI测试用例时,DevToolsActivePort文件不存在错误【代码】

Ubuntu18.04下Selenium配置chromedriver和geckodriver【代码】

如何解决ubuntu安装selenium时出现错误：Cannot fetch index base URL http://pypi.python.org/simple/【图】

ubuntu18.04 + Firefox + Selenium配置

SELENIUM - 相关标签

UBUNTU - 相关标签

配置 - 相关标签

UBUNTU - 最新教程

UBUNTU - 最热教程