Στην εργασία αυτή θα ασχοληθούμε με δεδομένα από γνωστή εφαρμογή ενοικίασης κατοικιών. Συγκεκριμένα σας δίνονται τα δεδομένα για την περιοχή της Αθήνας για 3 μήνες του 2019. Τα δεδομένα είναι σε μορφή csv και θα χρησιμοποιήσετε Python για να απαντήσετε στα παρακάτω ερωτήματα.
Σκοπός της εργασίας είναι η εξοικείωσή μας με τα βασικά στάδια της διαδικασίας που ακολουθούνται για την εφαρμογή τεχνικών εξόρυξης δεδομένων, ήτοι: συλλογή, προ-επεξεργασία / καθαρισμός, μετατροπή, εφαρμογή τεχνικών εξόρυξης δεδομένων και αξιολόγηση. Η υλοποίηση θα γίνει στην γλώσσα προγραμματισμού Python με την χρήση των εργαλείων/βιβλιοθηκών: jupyter notebook, pandas, gensim και SciKit Learn.