1. 云栖社区>
  2. 全部标签>
  3. #hadoop#
hadoop

#hadoop#

已有7人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Lucene.Net 2.3.1开发介绍 —— 简介

原文:Lucene.Net 2.3.1开发介绍 —— 简介          Lucene.Net是Lucene在dot net平台上的移植版本。它的功能与Lucene一样,都是用来提供一组API,让我们能快速开发自己的搜索引擎,当然,是全文搜索。

java hadoop Apache http 源码 SVN Framework lucene

Data Processing with SMACK: Spark, Mesos, Akka, Cassandra, and Kafka

Data Processing with SMACK: Spark, Mesos, Akka, Cassandra, and Kafka This article introduces the SMACK (Spark, Mesos, Akka, Cassandra, and Kafk

hadoop Cloud spark API SMACK Mesos Akka Cassandra Programming kafka Developer_blog

面试官培训-实战篇

什么是硬实力 无论任何级别都适用的基础 从两个例子来看基础的重要性 如何考基础 面试官本身对基础的“修练” 需要深度、兼顾广度 完善的事先准备 较科学的题库 科学的定级 不断自我改进 以思维导图方式整理面试题 每道...

大数据 hadoop 面试题 培训

开源大数据周刊-第71期

资讯 我国建成首个国家地质大数据平台“地质云” 国土资源部中国地质调查局11月6日发布了我国首个国家地质大数据共享服务平台“地质云”。这也是我国首次将国家核心地质数据库面向社会全领域公开共享,并提供地质信息一站式云端共享服务。

分布式 大数据 hadoop Apache http 互联网 spark 开源大数据 e-mapreduce 身份认证 Blog TensorFlow kerberos Sentry

Hadoop大象之旅001-安装VMware虚拟机

Hadoop大象之旅001-安装VMware虚拟机                                                   老帅    VMware虚拟机允许一台真实的电脑在一个操作系统中同时开启并运行数个操作系统,我的操作系统是Windows7x64,而Hadoop需要运行在Linux系统上。

linux hadoop windows 配置 用户体验 操作系统 空格

Hadoop大象之旅002-安装CentOS操作系统

Hadoop大象之旅002-安装CentOS操作系统                                   老帅    上一章中,我们已经准备好了VMWare虚拟机环境,这一章,我们就在虚拟机中安装操作系统。

linux hadoop windows 配置 主机 操作系统 centos 磁盘

Hadoop大象之旅003-配置CentOS操作系统

Hadoop大象之旅003-配置CentOS操作系统                                                                老帅    上一章中,我们已经在VMWare虚拟机中安装好了CentOS操作系统,为了后面即将安装的Hadoop能够正常运行,还需要对CentOS操作系统进行相关的配置。

hadoop 防火墙 配置 集群 SSH 主机 操作系统 centos

Hadoop大象之旅004-认识一下常用的Linux工具

Hadoop大象之旅004-认识一下常用的Linux工具                                                老帅    在企业开发中,对于Linux服务器的操作,一般是不会让人直接通过Linux桌面进行访问的,一般会由系统管理员分配账号和密码,然后通过工具登录服务器进行操作。

linux 服务器 hadoop windows 操作系统 centos 远程连接 utf-8

Hadoop大象之旅005-安装JDK环境

Hadoop大象之旅005-安装JDK环境                                             老帅     由于Hadoop 需要运行在JAVA平台,所以我们还需要在CentOS中安装java的环境,在这里,我们选择java的版本是jdk-6u45-linux-i586.

java hadoop path 配置 centos JDK

Hadoop大象之旅006-安装Hadoop环境

Hadoop大象之旅006-安装Hadoop环境                                                                老帅     我们的硬件电脑上跑的是Windows7x64,并且在Windows7安装好了VMWare10虚拟机,VMWare中也安装配置了CentOS6.5操作系统,CentOS中也已经安装配置了jdk1.6.0_45,并也准备好了连接CentOS的工具软件SecureCrSecureFx。

hbase hadoop path 配置 centos JDK

Hadoop大象之旅007-配置Hadoop伪分布模式

Hadoop大象之旅007-配置Hadoop伪分布模式                                                          老帅    安装hadoop分为本地模式、伪分布模式、集群模式。

分布式 hdfs hadoop 根目录 配置 集群 centos xml 分布式存储 replication

Hadoop大象之旅008-启动与关闭Hadoop

Hadoop大象之旅008-启动与关闭Hadoop                                                         老帅    Hadoop是一个运行在Linux文件系统上的分布式文件系统,在使用之前需要启动。

服务器 hdfs hadoop LOG 配置 分布式文件系统 WebServer Mapreduce 存储

Hadoop大象之旅009-通过Shell操作hdfs

Hadoop大象之旅009-通过Shell操作hdfs                                                                老帅 调用Hadoop分布式文件系统(HDFS)Shell命令应使用bin/hadoop fs 的形式。

linux hdfs hadoop 根目录 shell test PUT file

Hadoop大象之旅010-使用eclipse查看hadoop源码

Hadoop大象之旅010-使用eclipse查看hadoop源码                                                                老帅 我这使用的是hadoop-1.

hdfs hadoop Apache http 源码 eclipse Core JDK myEclipse

大数据安全之Hadoop生态圈背后不可忽视的隐藏“凶险”

伴随互联网的高速发展,大数据成为炙手可热的时髦产物。随之而来的是关于大数据的存储与计算问题。作为能够对大量数据进行分布式处理的软件框架——Hadoop目前已经发展成为分析大数据的领先平台,它能够以一种可靠、高效、可伸缩的方式进行数据处理。

大数据 安全 服务器 hdfs hadoop 加密 数据处理 数据仓库 集群 解决方案 身份认证 Mapreduce 存储 安全问道

两种配置大数据环境的方法Ambari以及hadoop源代码安装的步骤

1.Ambari安装 Ambari & HDP(Hortonworks Data Platform) ***************************************************************************************************** Base: 0.操作系统原则与对应的HDP对应的版本。

大数据 hbase hadoop http shell yum 配置 cluster centos spark Ambari Hive service

大数据处理的一些总结和应用(有关舆情监控)

    说到大数据处理可能大家都不会陌生,这是近年来非常火热的话题,各行各业都想借助大数据为自己助力,有了这个工具,就好像在飞机上看农田一般清晰,一目了然,也也就是业内人士常说的大数据提供了一个------上帝视角 大数据的概念: 1、指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理的时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的咨询。

分布式 大数据 监控 hadoop 配置 数据仓库 google 分布式系统 分布式存储 Mapreduce 情报分析

大数据基础知识问答----hadoop篇

handoop相关知识点 1.Hadoop是什么? Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。

分布式 大数据 hdfs hadoop 数据库 cluster 数据仓库 集群 Image node 问答 google 单点故障 分布式文件系统

大数据基础知识问答----spark篇,大数据生态圈

Spark相关知识点 1.Spark基础知识 1.Spark是什么? UCBerkeley AMPlab所开源的类HadoopMapReduce的通用的并行计算框架 dfsSpark基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。

分布式 大数据 hadoop 日志 数据库 问答 spark 搜索引擎 scala DataFrame string Hive class 存储

117
GO