Commit 671a208c authored by jibe-b's avatar jibe-b

Ajoute un exercice de régression linéaire et clustering

parent 6767d95a
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Session 4"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Visualisation avec Matplotlib\n",
"\n",
"[Guide d'utilisation de matplotlib](matplotlib.ipynb)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## K-mean clustering\n",
"\n",
"[Tutoriel Iris et clustering hiérarchique](k-means-clustering.ipynb)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Régression linéaire\n",
"\n",
"[Exercice avec la population par pays](world_population_prediction.ipynb)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Extraction de données en XMLS\n",
"\n",
"[Démo avec les questions à l'Assemblée Nationale](pandas-questions-answers.ipynb)"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Prédire la population de chaque pays"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Le jeu de données est issu des données de la banque mondiale : évolution de la population mondiale, pays par pays depuis 1960 : https://data.worldbank.org/indicator/SP.POP.TOTL\n",
"\n",
"Pour les pays dont la croissance est monotone, on peut réaliser une régression linéaire et classer les pays par catégorie.\n",
"\n",
"Cet exercice est dans une démarche d'exploration des données."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Récupération des données"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"!wget http://api.worldbank.org/v2/en/indicator/SP.POP.TOTL?downloadformat=csv \\\n",
" -O ../../data/raw/API_SP.POP.TOTL_DS2_en_csv_v2_566132.zip"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"!cd ../../data/raw/ && unzip API_SP.POP.TOTL_DS2_en_csv_v2_566132.zip"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"world_population_notindexed = pandas.read_csv(\"../../data/raw/API_SP.POP.TOTL_DS2_en_csv_v2_713131.csv\", skiprows=4)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"import pandas\n",
"from matplotlib import pyplot as plt"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Exercice"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Extraire les données et les traiter\n",
"\n",
"- Retirer les colonnes non indispensables\n",
"- indexer par pays"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": []
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Visualiser les données\n",
"\n",
"- présenter l'évolution de la population pour un pays\n",
"- présenter l'évolution de la population pour un groupe de pays sur le même graphique\n",
"- présenter l'évolution de la population pour un groupe de pays sur des graphiques en grille"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Réaliser une régression linéaire sur l'évolution de la population de la Suède\n",
"\n",
"- ajuster une régression linéaire sur l'évolution de la population de la Suède (Sweden)\n",
"- écrire une fonction qui écrit réalise cette régression linéaire sur tous les pays"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Extraire les coefficients de la régression linéaire dans une dataframe"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Réaliser un clustering des pays par rapport à leur coefficient de croissance relatif à la population totale"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment