Giter VIP home page Giter VIP logo

gd_parcial1_juan_sebastian_pineda's Introduction

GD_Parcial1_Juan_Sebastian_Pineda

  1. ¿Qué tipo de variables tiene el dataset? Detalle el tipo de variable de cada columna

gender variable cualitativa nominal

race/ethnicity variable cualitativa nominal

parental level of education variable cualitativa ordinal

lunch variable cualitativa ordinal

test preparation course variable cualitativa nominal

math score variable cuantitativa discreta

reading score variable cuantitativa discreta

writing score variable cuantitativa discreta



2. ¿Qué tipo de problemas de calidad de datos logra identificar? Defina e implemente las estrategias de limpieza de datos que correspondan.
No se encuentran problemas de valores faltanes ni incongruentes

3. ¿En qué asignatura en promedio los estudiantes obtuvieron un mejor puntaje?

De acuerdo al promedio los estudiantes tienen un mejor desempeño en la asignatura reading de acuerdo al score promedio 69.169, en comparación con el obtenido en math 66.089 y writting 68.054.
¿Hay evidencia de algún sesgo en la distribución de dichos puntajes?

Podemos ver un sesgo basados en el valor de la mediana y de manera visual usando un histograma.Donde puntualmente para los scores hay un sesgo importante hacia la derecha.

4. ¿Existe alguna correlación entre los puntajes obtenidos en las tres asignaturas?

Existe un correlación positiva considerable entre los scores de las 3 asignaturas siendo la de mayor valor entre writting y reading con 0.95

  1. ¿Hay alguna diferencia observable en los puntajes de la asignatura de matemáticas entre géneros? ¿Qué género obtuvo en promedio los mejores puntajes?


De acuerdo a los datos suministrados podemos ver diferencias significativas en los scores de la asignatura de matematicas , donde simplemente guiandonos por el rango de los datos podemos ver que para el genero femenino tenemos calificaciones minimas de 0, mientras que en el genero masculino tenemos un valor minimo de 27

Otra caracteristica importante es las medidas de dispersión donde para las observaciones del genero masculino tienen una desviación estandar menor que las encontradas en el genero femenino y los cuatiles estan en numeros ligeramente mas altos.

Esto impacta el score promedio de cada genero, encontrando que para el genero masculino esta en 68.7 y para el femenino en 63.6

6. ¿Qué nivel de escolaridad tienen los padres de los estudiantes que obtuvieron un puntaje por encima del percentil 85 en la asignatura de escritura? ¿Cómo se distribuye la escolaridad entre esta población?.

El nivel de escolaridad de los padres de los alumnos que cumplen este criterio se encuentran en su mayoria en el nivel de escolaridad associate's degree y some college, seguido por bachelor's degree en lo que indica que la mayoria de los padres tienen titulos mas de post secundaria

  1. ¿Qué porcentaje de los estudiantes obtuvieron puntajes iguales o superiores a 90 en las tres asignaturas? De estos estudiantes¿que porcentaje estudió para los exámenes?

Del total de estudiantes solamente el 2.8 porciento tiene calificacines por encima de 90 y 1.7 % se preparo para el examen

gd_parcial1_juan_sebastian_pineda's People

Contributors

jpined93 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.