Note Avant toute chose, veuillez choisir votre langue dans le menu Langs
(attention à ne pas avoir les 2 langues en même temps).
Note First of all, please choose your language from the Langs
menu (be careful not to have both languages at the same time).
Présentation du cours¶
Ce cours peut être utilisé pour deux cas d'apprentissage :
- pour faire du calcul scientifique avec Python et dans ce cas on peut sauter le chapitre 6 et ne pas regarder les bibliothèques graphiques qui dépendent de Pandas (Seaborn par exemple)
- pour manipuler des données (big data) et dans ce cas on peut sauter le chapitre 5
Les chapitres 2 et 3 sont pour les curieux qui désirent mieux connaitre Python. Ils ne sont pas nécessaires pour la suite et peuvent être sauté dans un premier temps. En résumé on a
Calcul scientifique | Big data |
---|---|
1 - Les bases de Python | 1 - Les bases de Python |
4 - Numpy | 4 - Numpy |
5 - Scipy | 6 - Pandas |
7 - Graphiques | 7 - Graphiques |
2 et 3 en bonus | 2 et 3 en bonus |
La maitrise de ces outils permet au scientifique de travailler ses données et de les présenter en quelques lignes de code très expressives.
Les biblothèques utilisées¶
Python offre de nombreuses bibliothèques scientifiques qui l'enrichissent et lui permette d'être l'une des toutes meilleures boite à outils pour le scientifique. Voici les bibliothèques principales présentées dans ce cours :
Les bibliothèques s'appuient sur celles en dessous d'elles. On a de bas en haut :
- Python qui est le langage avec déjà un grand nombre de structures et d'algorithmes bien utiles
- Numpy qui ajoute la notion de tableau performant et les algorithmes pour travailler sur ces tableaux
- Matplotlib la bibliothèque historique de tracé de courbes
- Plotly une bibliothèque de tracé de courbes dynamiques qui a le vent en poupe
- Scipy un ensemble d'algorithmes qui enrichissent Numpy et offrent un grand nombre d'outils pour le scientifique
- Pandas le super tableur qui permet de manipuler des très grands tableaux complexes
- Seaborn que l'on peut voir comme une extension de Matplotlib en y ajoutant un rendu plus léché et des graphiques statistiques
Les couleurs correspondent au type de la bibliothèque :
- marron : nouvelle structure de données
- jaune : ensemble d'algorithmes
- bleu : bibliothèque graphique
Dans ce cours on utilise les versions suivantes des bibliothèques :
from IPython.display import Markdown
import numpy, scipy, matplotlib, pandas, seaborn, plotly
import sys
echo = f"""
* Python {sys.version}
* Numpy {numpy.__version__}
* Scipy {scipy.__version__}
* Pandas {pandas.__version__}
* Matplotlib {matplotlib.__version__}
* Seaborn {seaborn.__version__}
* Plotly {plotly.__version__}
"""
Markdown(echo)
- Python 3.11.8 | packaged by conda-forge | (main, Feb 16 2024, 20:53:32) [GCC 12.3.0]
- Numpy 1.26.4
- Scipy 1.12.0
- Pandas 2.2.1
- Matplotlib 3.8.3
- Seaborn 0.13.2
- Plotly 5.19.0
D'autres bibliothèques seront utilisées pour des besoins locaux (datetime, tarfile, imageio...)
Environnement de travail (Jupyter)¶
Si Python est très largement enrichi par ses bibliothèques, il dispose aussi d'outils qui en facilitent l'utilisation. Le plus connu est Jupyter qui permet de travailler dans un navigateur ce qui offre la possibilité de mélanger du texte, du code et des images. C'est l'outil qu'utilise ce cours et d'ailleurs, vous être en train de regarder une feuille Jupyter (avec une cellule de code cachée).
Utilisation en dehors du cours¶
Vous pouvez installer Python, Jupyter, iPython et toutes les bibliothèques ci-dessus sur votre machine avec votre gestionnaire de paquet et pip ou Anaconda.
Vous pouvez aussi utiliser les services de Kaggle Kernel ou Google Colab. Tous les deux permettent de créer des feuilles Jupyter et de les exécuter.
{{ PreviousNext('/','Jupyter.ipynb') }}
Note : le △ ci-dessus renvoie à la table de matières.