Giter VIP home page Giter VIP logo

cuso-2023-printemps's Introduction

PySHS - Python pour les SHS - #pyshs - Programme doctoral en études numériques CUSO

Ce dépôt contient tous les éléments associés à la formation et sera mis à jour au cours de celle-ci.

Présentation générale

Cette formation propose une initiation à la programmation Python pour des doctorants•es en sciences humaines et sociales (SHS), pensée pour les usages en SHS.

Intervenants :

  • Emilien Schultz, Médialab / SESSTIM (http://eschultz.fr), emilien.schultz at sciencespo.fr
  • Mathieu Morey, Datactivist

Prérequis pour la première séance : installation du logiciel Anaconda qui installe les outils nécessaires (Python ainsi que les autres interfaces) : https://www.anaconda.com/products/individual

Liste des séances

30/03 - Pourquoi programmer en Python?

Cette séance sera l'occasion de faire un petit tour du langage Python et de l'univers qui l'entoure, pour identifier les principaux usages en SHS.

Langage Python – programmation scientifique – Notebook Jupyter - Exemples

06/04 - Les blocs de base du langage

Cette séance présentera les principaux ingrédients du langage Python, sa syntaxe et les blocs qui constituent un script : boucle, condition, ouverture d'un fichier, etc. La question des bonnes pratiques de programmation seront abordées.

Algorithme – Syntaxe - Fonctions – Bonnes pratiques

13/04 – Blocs de base du langage, suite

Python désigne à la fois le langage et les outils développés à partir de celui-ci. Les bibliothèques regroupent des outils déjà constitués pour réaliser des traitements plus avancés. Nous verrons comment se repérer dans l'univers de l'open source, identifier une bibliothèque, l'installer et l'utiliser pour collecter des données. Cela permettra de voir les bases du scrapping.

Bibliothèques – Scipy – Open source – Collecte de données

20/04 - Au-delà du langage : l'univers des bibliothèques et les communautés de pratiques

Une bibliothèque s'est imposée pour le traitement des données sous forme de tableaux : Pandas. Entre Excel et une base de données, elle permet d'automatiser de nombreux traitements. Cela nous amènera à charger des fichiers, à manipuler les colonnes en recodant certaines informations et à calculer des statistiques descriptives.

Pandas – tableaux – base de données – recodage

27/04 - Manipuler des tableaux de données avec Pandas, statistiques et visualisations

Cette séance présente les traitements statistiques possibles sur les données ainsi que les usages en termes de visualisation, de vues exploratoires des données à la production de graphiques finalisés pour la publication.

Visualisation – Statistiques – Matplotlib - Cartes

[Période pour avancer un projet personnel si souhaité]

04/05 – Traitements de données textuelles et résumé

Dans cette séance, nous aborderons à travers des exemples les usages plus avancés. Nous prendrons en particulier l'exemple des étapes nécessaires pour réaliser le traitement de données non structurées textuelles, allant des approches rapides à mettre en œuvre aux analyses plus spécifiques du langage mobilisant la bibliothèque de TAL SpaCy. Nous prendrons aussi un temps pour échanger sur les applications que vous auriez pu développer sur vos données.

Usages avancés – analyse textuelle – données non structurées

cuso-2023-printemps's People

Contributors

emilienschultz avatar

Stargazers

Mathieu Morey avatar  avatar  avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.