Giter VIP home page Giter VIP logo

nyc-taxi-data's Introduction

nyc-taxi-data

Einleitung

  • Ziel

    • Das Projekt wurde innerhalb des Moduls "Künstlich Intelligenz" an der IBS IT & Business School durchgeführt. Ziel der Arbeit ist dabei die Beantwortung von Fragestellungen durch Anwendung von erlernten theoretischen Konzepten. Eine Verknüpfung und daraus entstehende Synergie ergibt sich durch die Anwendung in der Praxis. In diesem spezifischen Fall die NYC Taxi Daten.
    • Fragestellung

      • Fragestellung 1: Prognostizieren von der Dauer einer Fahrt: Wie lange dauert wahrscheinlich eine Fahrt, wenn ich in einer bestimmten Zone zu einer bestimmten Zeit einsteige?
      • Fragestellung 2: Prognostizieren von Fahrtkosten: Wie teuer ist eine Fahrt, wenn ich in einer bestimmten Zone zu einer bestimmten Zeit einsteige?
  • Datenquelle:

    • Die Datenquelle ist die offizielle Seite der NYC Taxi & Limousine Commission. Seit 2009 bis 2022 werden die Daten gepflegt. Sie kann hier abgerufen werden. Die Daten sind Parquet Dateien.
  • Datenqualität

    • Die Datenqualität muss überprüft werden. Aussagen zur Qualität einer Information beziehen sich zum Beispiel darauf, wie genau diese die Realität ‚beschreibt‘ oder wie verlässlich sie ist, inwieweit sie also als Grundlage für eine Planung des eigenen Handelns verwendbar ist.
  • Datenanalyse

    • Vor der Aufbereitung wurde von uns ganz gezielt erst eine Analyse durchlaufen. Dabei mussten Einflussfaktoren die extern sind mit in Betracht gezogen werden. Darunter zum Beispiel auch Corona. Auch das Wetter wäre ein möglicher externer Einflussfaktor.
  • Datenaufbereitung

    • Anhand der Datenqualität müssen im Vorfeld Kriterien zur Bewertung definiert werden. Nachfolgend muss das Ergebnis für die Analyse verwendet werden.
  • Datenvisualisierung

    • Es wurde zur Visualisierung folium verwendet. Dieses Framework ist ein Python Package, das die Darstellung von Daten in Karten und Karteikarten ermöglicht. folium baut auf den Stärken des Python-Ökosystems bei der Datenverarbeitung und den Stärken der Leaflet.js-Bibliothek beim Mapping auf. Manipulationen der Daten in Python und visualisieren auf einer Leaflet-Karte mit Folium ist somit möglich.

Projekt Struktur

    • Analyse durch Verwendung von Boxplots, Grafiken und Scatterplots.
    • Prognosemodelle für Bestimmung von der Dauer und Preis einer Fahrt.
    • Analyse auf einer Karte.

nyc-taxi-data's People

Contributors

kenoc1 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.