Python pour un data scientist/economist

Lino Galiana

⚠ 🚧 Ce site est en construction 🚧

Structuration du site

Ce site web rend public le contenu du cours de deuxième année (Master 1) de l’ENSAE: Python pour les data-scientists et économistes 🐍.

Le cours est structuré sous la forme du présent site web et de notebooks jupyter proposant des exercices plus approfondis. L’ensemble des codes sources est stocké sous github à cette adresse.

Sur l’ensemble du site web, il est possible de cliquer sur la petite icone pour être redirigé vers le dépôt. Pour visualiser sous une forme plus ergonomique les notebooks (fichiers .ipynb) que ne le permet ce site web, vous trouverez parfois des liens nbviewer qui utilisent nbviewer une application de visualisation dédiée aux jupyter notebooks.

Des environnements temporaires d’exécution des notebooks sont proposés avec les icones suivantes Onyxia Binder Open In Colab

Vous pouvez naviguer dans l’architecture du site via la table des matières ou par les liens vers le contenu antérieur ou postérieur à la fin de chaque page.

Objectif du cours

Le but de ce cours est de rendre autonome sur l’utilisation de Python dans un contexte de travail de data scientist ou de social scientist (économie, sociologie, géographie…). Autrement dit, il présuppose qu’on désire faire un usage intense de données dans un cadre statistique rigoureux. Nous partirons de l’hypothèse que les notions de statistiques et d'économétrie pour lesquels nous verrons des applications informatiques sont connues. La facilité avec laquelle il est possible de construire des modèles complexes avec Python peut laisser apparaître que cet a priori est inutile. Il s’agit d’une grave erreur: même si l’implémentation de modèles est aisée, il est nécessaire de bien comprendre la structure des données et leur adéquation avec les hypothèses d’un modèle.

Les éléments relatifs à l'évaluation du cours sont disponibles dans la Section Evaluation

Last updated on 12 Jan 2021
Published on 16 Jul 2020
Edit on GitHub