大数据实战之环境搭建(一)

简介:

现在都在研究大数据,我最近也有幸小小接触了一下大数据,Cassandra&solr。今天我们就看一下Solr环境的搭建,首先去apache solr官网下载最新的Solr-4.3.0以及apache tomcat官网上的tomcat-7.0.40。还有最重要的东西jdk1.7。

222922980.jpg


第一步,环境变量的配置,本人系统是win7,32位。首先打开如下界面

223207112.jpg

点击环境变量,打开环境变量设置界面,首先配置JRE目录,如下。

223319483.jpg

223455956.jpg

然后再配置Path,如下,在最前面输入(.;%JAVA_HOME\bin;),即JRE的bin目录

223558607.jpg

OK,上面的步骤就已经将JDK环境变量配置好了。我们启动tomcat,进入tomcat目录下的bin目录。双击startup.bat。tomcat启动了,观察有没有什么错误输出,如果没有,那么说明tomcat安装成功了。

我们在浏览器输入http://localhost:8080, 如下,会出现tomcat的管理界面

224210116.jpg

第二步,就是Solr的配置了。

将solr目录下的dist\solr-4.3.0.war文件拷贝至tomcat的webapps目录下

224629473.jpg224710474.jpg

启动tomcat,将solr-4.30.war加压,如上图所示。解压完了之后,我们停止tomcat。在solr-4.3.0目录下新建一个文件夹叫Solr,然后将solr目录下的example\solr下面的文件拷贝至上面讲到的solr-4.3.0\Solr下面,如下图。

225550537.jpg

将上面这些文件拷贝至tomcat下的webapps\solr-4.3.0\Solr

225747992.jpg

在这里需要说的是,以前默认的文件夹名称不叫MyTest,你可以将它改成MyTest,但是需要修改solr.xml中的Cores节点如下,在这里core的name可以随便,instanceDir要修改为webapps下面solr所在的目录。

230007415.jpg

OK,在这里还需要将solr-4.3.0\example\lib\ext下面的所有jar包拷贝至tomcat的lib目录下

230318258.jpg

230408608.jpg

OK,以上步骤完成后,我们还有最后一个步骤,就是在tomcat的conf\Catalina\localhost目录下新建一个文件叫solr.xml,内容如下

232026810.jpg


230712580.jpg

OK,以上就是所有的配置,这个时候我们在浏览器输入http://localhost:8080/solr ,出现solr的管理界面,如下,是不是很爽

230949942.jpg

我们下拉界面中的Core Selector,我们看到了刚才创建的实例MyTest

231104123.jpg

选择后,我们就可以对这个实例进行管理了,可以查询,查看schema等。我们点击query,查询一下,如下条件默认为*:*,意思是查询solr中所有有的数据

231311490.jpg

在右侧已经给我们呈现了response的xml格式的数据。好了,今天就讲到这里,下节主要讲cassandra环境的搭建。



本文转自 BruceAndLee 51CTO博客,原文链接:http://blog.51cto.com/leelei/1219779,如需转载请自行联系原作者


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
SQL 分布式计算 数据可视化
滴滴出行大数据数仓实战
滴滴出行大数据数仓实战
115 0
滴滴出行大数据数仓实战
|
4月前
|
SQL 分布式计算 大数据
【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
37 0
|
4月前
|
安全 大数据 API
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
62 0
|
4月前
|
SQL 分布式计算 数据库
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
85 0
|
2月前
|
分布式计算 大数据 Java
Spark 大数据实战:基于 RDD 的大数据处理分析
Spark 大数据实战:基于 RDD 的大数据处理分析
120 0
|
4月前
|
SQL 存储 大数据
手把手教你大数据离线综合实战 ETL+Hive+Mysql+Spark
手把手教你大数据离线综合实战 ETL+Hive+Mysql+Spark
88 0
|
4月前
|
机器学习/深度学习 分布式计算 搜索推荐
【大数据技术】Spark MLlib机器学习协同过滤电影推荐实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习协同过滤电影推荐实战(附源码和数据集)
73 0
|
4月前
|
机器学习/深度学习 分布式计算 前端开发
【大数据技术】Spark MLlib机器学习线性回归、逻辑回归预测胃癌是否转移实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习线性回归、逻辑回归预测胃癌是否转移实战(附源码和数据集)
34 0
|
4月前
|
机器学习/深度学习 分布式计算 大数据
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
27 0
|
4月前
|
消息中间件 分布式计算 大数据
【大数据技术】Spark+Flume+Kafka实现商品实时交易数据统计分析实战(附源码)
【大数据技术】Spark+Flume+Kafka实现商品实时交易数据统计分析实战(附源码)
67 0