首页 / TOMCAT / nutch+tomcat安装详细教程

nutch+tomcat安装详细教程

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了nutch+tomcat安装详细教程，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4385字，纯文字阅读大概需要7分钟。

内容图文

环境OracleLinux-R7-U2-Server-x86_64

tomcat8.5官网下载：http://apache.opencas.org/tomcat/tomcat-8/v8.5.0/bin/apache-tomcat-8.5.0.tar.gz

nutch1.0载：http://archive.apache.org/dist/nutch/nutch-1.0.tar.gz

jdk-8u77官网下载：http://download.oracle.com/otn-pub/java/jdk/8u77-b03/jdk-8u77-linux-x64.rpm

将下载文件拷贝至/server目录下

1、安装jdk

[root@Nutch ~]# cd /server

[root@Nutch server]# rpm -ivh jre-8u77-linux-x64.rpm

[root@Nutch server]# java -version

java version "1.8.0_77"

Java(TM) SE Runtime Environment (build 1.8.0_77-b03)

Java HotSpot(TM) 64-Bit Server VM (build 25.77-b03, mixed mode)

配置环境变量

[root@Nutch server]# vi /etc/profile

在文件最后添加以下内容

export JAVA_HOME=/usr/java/jdk1.8.0_77

export JAVA_BIN=/usr/java/jdk1.8.0_77/bin

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

保存退出

使用source使参数生效

[root@Nutch server]# source /etc/profile

2、安装compat-libstdc++

[root@Nutch server]# yum install compat-libstdc++*

3、安装nutch

登录nutch用户

[@Nutch server]# su - nutch

赋予nutch用户权限

[nutch@Nutch ~]$ chown -R nutch.nutch /server/

解压nutch

[nutch@Nutch ~]$ cd /server/

[nutch@Nutch server]$ tar zxvf nutch-1.0.tar.gz

修改解压后文件名称为nutch

[nutch@Nutch server]$ mv nutch-1.0 nutch

4、安装tomcat

解压tomcat

[nutch@Nutch server]$ tar zxvf apache-tomcat-8.5.0.tar.gz

修改解压后文件名称tomcat

[nutch@Nutch server]$ mv apache-tomcat-8.5.0 tomcat

启动tomcat（防火墙8080已开放）

[nutch@Nutch server]$ tomcat/bin/startup.sh

浏览器登录http://<ip>:8080查看是否成功

5、配置tomcat

删除tomcat/webpaas/ROOT下所有文件

复制nutch文件夹下nutch1.0.war至tomcat/weapps/ROOT下

[nutch@Nutch ~]$ cp /server/nutch/nutch-1.0.war /server/tomcat/webapps/ROOT/nutch.war

进入ROOT目录下解压nutch.war

[nutch@Nutch ~]$ cd /server/tomcat/webapps/ROOT

[nutch@Nutch ROOT]$ jar xvf nutch.war

启动tomcat进入浏览区查看是否可以进入nutch搜索界面

[nutch@Nutch ROOT]$ /server/tomcat/bin/startup.sh

配置nutch-site.xml文件

[nutch@Nutch ROOT]$ cd /server/tomcat/webapps/ROOT/WEB-INF/classes/

[nutch@Nutch classes]$ vi nutch-site.xml

在<configuration></configuration>之间添加以下内容

<name>searcher.dir</name>

<value>/server/crawl.demo</value> //value的值指向nutch抓取的页面的保存目录

</property>

<name>http.agent.name</name>

<value>nutch-1.0</value>

<description>HTTP ‘User-Agent‘</description>

</property>

</configuration>

配置 server.xml文件

[nutch@Nutch classes]$ cd /server/tomcat/conf/

[nutch@Nutch conf]$ vi server.xml

找到Connector port="8080"语句并添加最后两句内容

<Connector port="8080" protocol="HTTP/1.1"

connectionTimeout="20000"

redirectPort="8443"

URIEncoding="UTF-8"

useBodyEncodingForURI="true"/>

保存退出

6、配置nutch

[nutch@Nutch conf]$ cd /server/nutch/conf/

配置crawl-urlfilter.txt文件

[nutch@Nutch conf]$ vi crawl-urlfilter.txt

将一下内容

# accept hosts in MY.DOMAIN.NAME

+^http://([a-z0-9]*\.)*MY.DOMAIN.NAME/

修改为（根据自己搜索的内容更改）

# accept hosts in MY.DOMAIN.NAME

+^http://([a-z0-9]*\.)*com/

+^http://([a-z0-9]*\.)*cn/

+^http://([a-z0-9]*\.)*net/

配置regex-urlfilter.txt文件

[nutch@Nutch conf]$ vi regex-urlfilter.txt

将最后一个行注释掉，并在最后添加以下内容

# accept anything else

#+.

+^http://([a-z0-9]*\.)*com/

+^http://([a-z0-9]*\.)*cn/

+^http://([a-z0-9]*\.)*net/

配置nutch-site.xml文件

在<configuration></configuration>中间填写一下语句

<name>http.agent.name</name>

<value>Nutch nutch agent</value>

</property>

<name>http.agent.version</name>

</property>

</configuration>

配置urls目录

在/server下新建urls目录

[nutch@Nutch conf]$ cd /server/

[nutch@Nutch server]$ mkdir urls

新建url文件并填写需要搜索的网站域名（本人填写的是http://www.qq.com）

[nutch@Nutch urls]$ vi url

配置nutch抓取的页面的保存目录

[nutch@Nutch conf]$ cd /server/

[nutch@Nutch server]$ mkdir crawl.demo

执行抓取命令

[nutch@Nutch server]$ cd /server/nutch

[nutch@Nutch nutch]$ bin/nutch crawl /server/urls -dir /server/crawl.demo -depth 2 -threads 4 -topN 50 >& /server/crawl.demo/crawl.log

如果报Error: JAVA_HOME is not set可在shell中用nutch执行一次export JAVA_HOME=/usr/java/jdk1.8.0_77

# /server/urls是存放网址的文件夹目录

# -dir /server/crawl.demo是抓取的页面的存放目录,与3.1.2中的设定搜索目录是对应的

# -depth指爬行的深度，这里处于测试的目的，选择深度为 2 ，完全爬行一般可设定为10左右

# -threads指定并发的进程这是设定为 4

# -topN指在每层的深度上所要抓取的最大的页面数，完全抓取可设定为1万到100万，这取决于网站资源数量

# 抓取过程写入/server/crawl.demo/crawl.log中

抓取完毕可到web页面进行搜索

到此为止nutch安装完毕

本文出自 “linux” 博客，谢绝转载！

原文：http://sxp309932147.blog.51cto.com/10045843/1759596

内容总结

以上是互联网集市为您收集整理的nutch+tomcat安装详细教程全部内容，希望文章能够帮你解决nutch+tomcat安装详细教程所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1206180.html

来源：【匿名】

【下一篇】tomcat是干什么的？

更多 ►

【nutch+tomcat安装详细教程】教程文章相关的互联网学习教程文章

nutch+tomcat安装详细教程

环境OracleLinux-R7-U2-Server-x86_64tomcat8.5官网下载：http://apache.opencas.org/tomcat/tomcat-8/v8.5.0/bin/apache-tomcat-8.5.0.tar.gznutch1.0载：http://archive.apache.org/dist/nutch/nutch-1.0.tar.gzjdk-8u77官网下载：http://download.oracle.com/otn-pub/java/jdk/8u77-b03/jdk-8u77-linux-x64.rpm将下载文件拷贝至/server目录下1、安装jdk[root@Nutch ~]# cd /server[root@Nutch server]# rpm -ivh jre-8u77-linux...

Linux——java+tomcat+maven 安装【代码】【图】

一、java1、清理系统自带的 jdk 查看系统带的 java jdk　　 rpm -qa | grep jdk　　卸载命令　　 sudo yum remove jdk的名字　　2、安装　　 sudo rpm -ivh jdk-8u161-linux-x64.rpm　　　　( 默认安装路径 /usr/java/jdk1.8.0_161 )　　3、配置环境变量　　　vim /etc/profile　　　　添加：1exportJAVA_HOME=/usr/java/jdk1.8.0_161 2 export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib...

Linux上安装Tomcat

linux服务器中查看tomcat及jdk版本，直接输入: sh version.sh 即可[root@bogon bin]# wget http://devtools.z.gldcg.com/Tomcat/TOMCAT8/linux/apache-tomcat-8.0.24.tar.gz[root@bogon bin]# tar -xvf apache-tomcat-8.0.24.tar.gz 原文：https://www.cnblogs.com/xiaoQ0725/p/8485654.html

玩转阿里云服务器——安装Web服务器Tomcat7【代码】【图】

1. 以root用户身份登录阿里云服务器2. 使用apt-get install安装Tomcat7sudo apt-get install tomcat73.安装后，Tomcat在启动时报错*Starting Tomcat servlet engine tomcat7 [fail]但是tomcat7的主页仍然可以访问，具体原因不详，以后再说吧4.测试在自己电脑浏览器里输入http://阿里云主机IP:8080/出现如下页面 /*‘).addClass(‘pre-numbering‘).hide();$(this).addClass(‘has-numbering‘).parent().append($numbering);fo...

linux安装tomcat

第一步上传；第二步解压：　　 tar -zxvf apache-tomcat-7.0.57.tar.gz 第三步进入bin目录下，启动　　 cd apache-tomcat-7.0.57　　cd bin/　　./startup.sh 第四步访问：　　192.168.47.128;8080　　看到一只猫。。。　　ok原文：https://www.cnblogs.com/lxl-six/p/11020057.html

Win7下Solr4.10.1和TomCat8的安装【图】

1、系统为win7 64位系统，安装有wamp的环境，我的所有网站放在 d:\webserver下，域名指向该目录下的子目录；2、安装TomCat8到 D:\Tomcat 8.0；3、在 d:\webserver下创建solr目录，并且在solr目录下创建data目录（data文件夹为存储查询索引和数据的地方）；4、解压solr-4.10.1文件至d:\solr-4.10.1目录，将 d:\solr-4.10.1\example\solr 下的所有文件的所有文件（不含solr文件夹本身）拷贝到d:\webserver\solr目录下5、创建solr web...

liunux上centos7上安装jdk,mysql,tomcat手把手良心教程【代码】

准备工作：本地安装：rpm -ivh 程序名本地查看：rpm -qa本地卸载：rpm -e --nodeps 程序名因为jdk,tomcat,mysql的安装过程需要从网上下载部分支持包才可以继续，所以要求提前安装下载好依赖。yum install glibc.i686 yum -y install libaio.so.1 libgcc_s.so.1 libstdc++.so.6 yum update libstdc++xx.xx.xx-xxx86_64 yum install gcc-c++ 原文：https://www.cnblogs.com/smfx1314/p/8822651.html

初识TomCat之2——TomCat介绍及安装【图】

一、TomCat介绍通过之前的介绍，Tomcat与JDK共同构成了一个Web Container容器，它在JDK的基础上提供了Servlet和JSP组件，可以接受来自客户端的动态请求，整个TomCat的核心组件由Catalina、Coyote和Jasper组成。Catalina实现Servlet容器功能，Coyote实现http连接器功能，Jasper（JSP Engine）将接收到的请求转换为Java代码。整个TomCat从结构上划分如下图所示：Server：tomcat是在java进程中运行的一个实例，一个Server即是一个tomc...

docker安装tomcat【图】

第一种方式官方方式 Mr.right 上面代表直接下载并运行tomcat第二种方式常用方式原文：https://www.cnblogs.com/rerise/p/15165088.html

linux下安装tomcat8.0【代码】【图】

环境：rhel6.5 tomcat：apache-tomcat-8.0.30.tar jdk：jdk-8u65-linux-x64.rpm下载tomcat地址：http://tomcat.apache.org/download-80.cgi 下载jdk地址：http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 安装tomcat前，需要先安装jdk：rpm -ivh jdk-8u65-linux-x64.rpm //rpm安装jdkrpm -pql jdk-8u65-linux-x64.rpm //查看jdk安装的位置vim /etc/profile //在最后添加，设...

【Tomcat】Tomcat安装及Eclipse配置教程【图】

目录：1.安装JDK和配置2.安装Tomcat和配置3.安装Eclipse和配置4.Web程序的使用和发布举例1. 安装JDK和配置JDK的安装参照：http://jingyan.baidu.com/article/bea41d435bc695b4c41be648.html（1）下载JDK安装包 http://rj.baidu.com/soft/detail/14459.html?ald（2）按照步骤点击下一步进行JDK软件的安装。（3）配置JavaJDK的环境变量** 配置环境变量包括java_home，path和classpath三个部分 1）用鼠标右击“我的电脑”，选择“...

Tomcat安装与使用【代码】

Tomcat安装与使用主要讲解Tomcat的安装与使用，讲解ubuntu版本和windows。下载与安装：1）到apache官网。www.apache.org http://jakarta.apache.org(产品的主页)2）安装版：window （exe、msi） linux（rmp）压缩版：window（rar，zip） linux（tar，tar.gz）建议下载压缩版3）下载压缩版，解压到本地解压后的文件夹如下：windows和linux下都是一样的。运行和关闭tomcatwindows启动软件：到/bin目录下找到startup.bat ，双击这个...

ansible-role安装nginx，keepalived，tomcat【代码】【图】

role下载地址链接：https://pan.baidu.com/s/1DVdt1iykf8z9kqlaqW9p6Q 提取码：cnkx 复制这段内容后打开百度网盘手机App，操作更方便哦架构 roles目录结构[root@localhost roles]# tree . ├── keepalived │ ├── files │ ├── handlers │ │ └── main.yml │ ├── tasks │ │ └── main.yml │ ├── templates │ │ ├── backup_keepalived.conf.j2 #主keepalived配置文件 │ │...

Jsp之二 tomcat安装配置使用【图】

? Tomcat的安装以及配置Tomcat的版本很多，每个版本的区别是很大的，但在实际的使用上都是大同小异，现在常用的版本为5.x或者6.x,，这些版本在网上下载都是很容易的。从安装方式上来看分为：安装版与解压版，我们主要讨论这种情况。安装版tomcat我们下载的是一个exe文件如图所示，对于windows系列系统来说，安装的步骤很简单如下图所示。在安装的过程中，需要注意：tomca会要求用户指定jdk安装目录，即comcat的运行时需要jdk...

Centos7.3安装Tomcat和MySQL并部署JavaWeb应用【代码】【图】

CentOS版本查看：rpm -q centos-release 一、Tomcat安装1.下载方式一：我在/home目录下安装wget http://mirrors.hust.edu.cn/apache/tomcat/tomcat-8/v8.5.49/bin/apache-tomcat-8.5.49.tar.gz 安装完会生成一个压缩包方式二：tomcat-8.5.49下载压缩包到文件夹 2.解压tar -zxvf apache-tomcat-8.5.49.tar.gz解压完后会在当前目录生成一个文件夹若觉得名字太长，可以改个名字#更改文件名 mv apache-tomcat-8.5.49 tomcat#删除安装包...

教程 - 相关标签

教程分享教程网站教程下载

TOMCAT - 最热教程

centos6.4下安装配置JDK+TOMCAT+MYSQL教...Tomcat各版本及源码包的下载详细教程 Tomcat 与 Java Web开发技术详解（第三...nginx+tomcat导致request取数错误问题 Tomcat爆出严重漏洞，影响所有版本，附...Linux 安装tomcat及tomcat自带远程部署...windows下Tomcat详细安装配置教程 eclipse导入tomcat时Unknown version o...未关闭InputStream导致Tomcat意外死掉，...linux下启动tomcat后,浏览器无法访问

首页 / TOMCAT / nutch+tomcat安装详细教程

nutch+tomcat安装详细教程

内容导读

内容图文

内容总结

内容备注

内容手机端

【nutch+tomcat安装详细教程】教程文章相关的互联网学习教程文章

nutch+tomcat安装详细教程

Linux——java+tomcat+maven 安装【代码】【图】

Linux上安装Tomcat

玩转阿里云服务器——安装Web服务器Tomcat7【代码】【图】

linux安装tomcat

Win7下Solr4.10.1和TomCat8的安装【图】

liunux上centos7上安装jdk,mysql,tomcat手把手良心教程【代码】

初识TomCat之2——TomCat介绍及安装【图】

docker安装tomcat【图】

linux下安装tomcat8.0【代码】【图】

【Tomcat】Tomcat安装及Eclipse配置教程【图】

Tomcat安装与使用【代码】

ansible-role安装nginx，keepalived，tomcat【代码】【图】

Jsp之二 tomcat安装配置使用【图】

Centos7.3安装Tomcat和MySQL并部署JavaWeb应用【代码】【图】

安装 - 相关标签

教程 - 相关标签

TOMCAT - 最新教程

TOMCAT - 最热教程