python3.4.4+solr5.5+hadoop2.6.3
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python3.4.4+solr5.5+hadoop2.6.3,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1429字,纯文字阅读大概需要3分钟。
内容图文
![python3.4.4+solr5.5+hadoop2.6.3](/upload/InfoBanner/zyjiaocheng/1239/951a782dac0143d68e02ccb595ace25e.jpg)
1.通过python编写爬虫,数据存储到hdfs当中
2.通过solr在hdfs当中建立索引并实现全文检索功能
好了,正文开始了!
一,环境搭建
1.python3.4.4安装及环境变量配置
2.hadoop2.6.3安装及环境变量配置(单机)
3.solr5.5安装及配置
1. 下载tomcat9 及solr5.5
2.解压tomcat9级solr5.5 存放路径为tomcat9:/usr/local/solr/tomcat9
solr5.5:/usr/local/solr/solr-5.5.0
3.在tomcat的webapps中新建文件夹solr
mkdir solr
把solr-5.5.0\server\solr-webapp\webapp目录下的文件全部复制进来
cd /usr/local/solr/solr-5.5.0/server/solr-webapp/webapp/
cp -r * /usr/local/solr/tomcat9/webapps/solr/
4.在tomcat9的WEB-INF文件下新建classes文件夹,把solr-5.5.0\server\resources\log4j.properties复制到classes文件夹里,这样才能看到solr的日志。
cd /usr/local/solr/tomcat9/webapps/solr/WEB-INF/
mkdir classes
cp /usr/local/solr/solr-5.5.0/server/resources/log4j.properties /usr/local/solr/tomcat9/webapps/solr/WEB-INF/classes/
5.修改 WEB-INF/web.xml
< env-entry > < env-entry-name >solr/home</env-entry-name><env-entry-value>/usr/local/solr/solr_home</env-entry-value><env-entry-type>java.lang.String</env-entry-type></env-entry>
在/usr/local/solr/目录下执行
mkdir solr_home
6.把 solr-5.5.0\server\lib\ext 下的jar包全部复制到 WEB-INF/lib目录下
7.在solr_home(WEB-INF/web.xml指定的目录)中创建一个core_sea(名字随意),core1中创建两个文件夹,data,conf。
把 solr-5.5.0\server\solr\configsets\basic_configs\conf 里边的文件全部复制到 新建的conf文件下。
把solr-5.5.0\server\solr\solr.xml复制到 core1同级下。
8.结束,启动tomcat, 输入http://localhost:8080/solr/index.html 。访问正常,即成功。
阿斯顿
原文:http://www.cnblogs.com/sunjter/p/5510893.html
内容总结
以上是互联网集市为您收集整理的python3.4.4+solr5.5+hadoop2.6.3全部内容,希望文章能够帮你解决python3.4.4+solr5.5+hadoop2.6.3所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。