Giter VIP home page Giter VIP logo

bigdatadeveloper's Introduction

BigDataDeveloper

Descripción del Repositorio

Este repositorio cuenta con las siguientes herramientas:

  • MySQL
  • Hadoop
  • Spark
  • Hive
  • Jupyter

Todo el contenido se ejecutara en codespace de github.

Desplegar container

  1. Crear un codespace para el repositorio e ingresar al mismo
  2. Abrir terminal de codespace
  3. Ejecutar el siguiente comando para desplegar los contenedores
    >_ docker-compose up
    Esta linea desplegara los contenedores y podras ver estos utilizando la extension Docker explorer

MySQL

Este contenedor contiene una base de datos llamada retail_db y consta de las siguientes tablas:

  • customers
  • orders
  • order_items
  • products
  • categories
  • departments

credenciales:
user: root
pass: root
port: 3310
Ejecutar ifconfig en terminal para obtener la ip (eth0)

Hadoop

Para poder trabajar con hadoop ingresamos al contenedor del datanode.
Abrimos un terminal nuevo y ejecutamos lo siguiente >_ docker exec -it datanode bash
Asi para cada contenedor con el que queremos trabajar.

Para utilizar sqoop en el datanode debemos ejecutar lo siguiente >_ sh /datanode/scripts/script.sh

Para exportar las tabla de la base de datos retail con sqoop ejecutar lo siguiente: >_ sh /datanode/scripts/sqoop/script_sqoop_textfile.sh

Hive

Para poder trabajar con hive ingresamos al contenedor del hive-server.
Abrimos un terminal nuevo y ejecutamos lo siguiente >_ docker exec -it hive-server bash

Para crear tablas externas en base a los datos importados con sqoop ejecutamos los siguientes pasos:

Abrir un terminal y copiar el archivo hive.hql a hive-server >_ docker cp datanode/scripts/hive/hive.hql hive-server:/opt
En el terminal de hive-server ejecutamos lo siguiente para crear las tablas. >_ hive -f /opt/hive.hql

bigdatadeveloper's People

Contributors

huamank avatar steyler avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.