Giter VIP home page Giter VIP logo

hadoop-hbase-zookeeper-hive's Introduction

Vagrant + Hadoop Cluster + Hbase + Zookeeper + Hive

Objetivo desse projeto estudo é levantar 4 maquinas virtuais em cluster rodando Apache Hadoop pre-instalado.

Algumas informações foram retiradas do site. http://cscarioni.blogspot.co.uk/2012/09/setting-up-hadoop-virtual-cluster-with.html

Deploy do cluster

Primeiramente precisaremos duas ferramentar para a execução da virtualização. Mas atenção, esse tutorial somente vai funcionar em ambiente *UNIX.

Com seu *UNIX já configurado e rodando tudo 100%. Instale.

Todas as informações de como instalar estão nas faqs e docs dos próprios sites.

Feito todo o processo de instalação das duas ferramentas, clone o projeto, e faça o download dos Boxes que irão instalar como base. A meu gosto, utilizei o ubuntu, apesar de não ser o melhor, me facilitou muito na hora das instalações.

Executando o Vagrant para subir o iso e startando a VM:

$ vagrant box add ubuntu64 http://files.vagrantup.com/precise64.box
$ vagrant up

O script vai levantar 4 máquinas de 512mb de memoria - master, hadoop1, hadoop2 e hadoop3. Ajustes edite Vagrantfile.

As máquinas utilizam o Puppet para instalar e configura todos aplicativos necessários utilizados no cluster.

Diretório padrão de instalação é /opt/xxxxxxx-0.0.0 e todos estão em PATH.

A maquina master executa o namenode and jobtracker, o restante é data nodes e trackers.

Inicio Cluster

Depois de rodar o Vagrant, vamos formatar o Apache Hadoop na master.

 $ vagrant ssh master
 $ (master) sudo /opt/hadoop-1.2.1/bin/hadoop namenode -format -force
 $ (master) sudo /opt/hadoop-1.2.1/bin/start-all.sh

 $ (master) sudo /opt/hbase-0.94.11/bin/start-hbase.sh

Liberando o Cluster(hbase) transparente

Incluindo a porta do HBase tanto de entrada como saida.

$ (master) sudo su
$ ssh hadoop1
$ sudo iptables -A PREROUTING -t nat -i eth1 -p tcp --dport 60020 -j DNAT --to 10.0.1.111:60020
$ exit

$ ssh hadoop2
$ sudo iptables -A PREROUTING -t nat -i eth1 -p tcp --dport 60020 -j DNAT --to 10.0.1.112:60020
$ exit

$ ssh hadoop3
$ sudo iptables -A PREROUTING -t nat -i eth1 -p tcp --dport 60020 -j DNAT --to 10.0.1.113:60020
$ exit

Para o Cluster

 $ vagrant ssh master
 $ (master) sudo stop-all.sh
 $ exit or Ctrl-D
 $ vagrant halt

utilizando de novo o cluster:

 $ vagrant up
 $ vagrant ssh master
 $ (master) sudo start-all.sh

Destroindo o Cluster

 $ vagrant destroy

Isso irá excluir no modo HARD, os arquivos salvos não serão possíveis restauração.

Interface WEB

Visualizando a inteface do Hadoop

Inserindo o mesmo range de ips que foi utilizado para gerar o cluster, será necessário colocar eles dentro do seu /etc/hosts.

namenode : http://master.local:50070/dfshealth.jsp jobtracker : http://master.local:50030/jobtracker.jsp

Visualizando a inteface do Hbase

master : http://master.local:60010/master-status

Vagrant comandos.

Logar na maquina master.

$ vagrant ssh master
$ (master) hadoop fs -ls /
$ ...

Data

Hadoop

namenode : `/srv/hadoop/namenode` 
datanodes : `/srv/hadoop/datanode`

Puppet (automação)

Caso alguma alteração no Vagrantfile, e precise testa-lo ou replica-lo, utilize :

$ vagrant provision

Atualizações do projeto

  • patchs, atualizações e dicas são bem-vindas neste projeto. =)

hadoop-hbase-zookeeper-hive's People

Contributors

thiagozs avatar

Watchers

James Cloos avatar Aaron Zhang avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.