import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline
%config InlineBackend.figure_format = 'retina'

sns.__version__

'0.13.2'

sns.set_style('whitegrid')   # background
sns.set_context("notebook")  # change size of font, can be: paper (default), notebook, talk, poster

import pandas as pd
import datetime as dt
import numpy as np

mayors = pd.read_excel("data/maires-2014.xlsx")

mayors.head()

mayors.Genre.value_counts()

Genre
M    30171
F     5715
Name: count, dtype: int64

ax = sns.lineplot(x=np.arange(len(mayors)), y=np.sort(mayors['Population de la commune']))
ax.set_title('Taille des %d communes' % len(mayors))
ax.set(yscale='log') # you can try without a logarithm scale in y to see the result

[None]

g = sns.relplot(data=mayors, x='Age', y='Population de la commune')
g.set(yscale='log') # same, without the log scale we cannot see anything

<seaborn.axisgrid.FacetGrid at 0x7f043e2d2450>

sns.set_style('dark')
sns.set_context("talk")

color_profession = {'agriculture':'g','industrie/commerce':'brown', 'privé':'cyan', 'libéral':'b', 'divers':'pink',
                    'fonctionnaire':'yellow', 'enseignement':'orange', 'entrep. publique':'r', 'retraité':'black'}
g = sns.relplot(data=mayors, x='Age', y='Population de la commune', hue='Type profession', palette=color_profession,
                marker='.', col='Genre')
g.set(yscale='log')

<seaborn.axisgrid.FacetGrid at 0x7f043ee93610>

sns.set_style('white')
sns.set_context("notebook")
g = sns.relplot(data=mayors, x='Age', y='Population de la commune', hue='Genre', col='Type profession', col_wrap=3)
g.set(yscale='log', xlim=(20,100), ylim=(1,3000000))

<seaborn.axisgrid.FacetGrid at 0x7f043e301a90>

sns.set_style('darkgrid')

mayors['Taille commune'] = np.log10(mayors['Population de la commune'])
sns.pairplot(data=mayors[mayors['Type profession']=='fonctionnaire'][['Age', 'Taille commune', 'Genre']], 
             markers='+', hue='Genre', aspect=2)

<seaborn.axisgrid.PairGrid at 0x7f043d5fd190>

sns.set_style('whitegrid')

g = sns.catplot(data=mayors, x='Type profession', y="Age", hue="Genre", palette="muted", 
                kind='violin', scale='count', split=True, aspect=3)
g.set(title="Pyramide des âges des maires pour chaque famille de profession") # Mayors' age-sex pyramid for each type of professions
g.set_xticklabels(rotation=30, ha='right')

/tmp/ipykernel_627/366515780.py:1: FutureWarning: 

The `scale` parameter has been renamed and will be removed in v0.15.0. Pass `density_norm='count'` for the same effect.
  g = sns.catplot(data=mayors, x='Type profession', y="Age", hue="Genre", palette="muted",

<seaborn.axisgrid.FacetGrid at 0x7f043e222810>

g = sns.catplot(data=mayors[mayors['Type profession']=='divers'], x='Code profession', y="Age", hue="Genre", 
                kind='swarm', aspect=3)

sns.set_style('white')
sns.jointplot(x=mayors.Age, y=np.log10(mayors['Population de la commune']), kind='kde',
              height=8, xlim=((20,100)), ylim=np.log10((1,3000000)))

<seaborn.axisgrid.JointGrid at 0x7f042f632450>

sns.set_style('whitegrid')
plt.figure(figsize=(10, 5))
sns.distplot(mayors.Age, bins=33)

/tmp/ipykernel_627/2318274114.py:3: UserWarning: 

`distplot` is a deprecated function and will be removed in seaborn v0.14.0.

Please adapt your code to use either `displot` (a figure-level function with
similar flexibility) or `histplot` (an axes-level function for histograms).

For a guide to updating your code to use the new functions, please see
https://gist.github.com/mwaskom/de44147ed2974457ad6372750bbe5751

  sns.distplot(mayors.Age, bins=33)

<Axes: xlabel='Age', ylabel='Density'>

len(mayors[(mayors.Age > 69.5) & (mayors.Age < 70.5)]) / len(mayors)

0.04851474112467257

plt.figure(figsize=(10, 6))
ax =sns.regplot(data=mayors[mayors.Genre=='M'], x='Age', y='Population de la commune', color='b', marker='.', order=3)
sns.regplot(data=mayors[mayors.Genre=='F'], x='Age', y='Population de la commune', color='orange', marker='.', order=3)
ax.set(yscale='log', xlim=(20,100), ylim=(1,3000000))

[None, (20.0, 100.0), (1, 3000000)]

g = sns.catplot(data=mayors, x='Type profession', y="Age", hue="Genre", palette="muted", 
                kind='box', aspect=3)
g.set(title="Quartiles des âges des maires pour chaque famille de profession") # Mayors' age-sex pyramid for each type of professions
g.set_xticklabels(rotation=30, ha='right')

<seaborn.axisgrid.FacetGrid at 0x7f043d5e8a50>

	Unnamed: 0	Code du département (Maire)	Libellé de département (Maires)	Code Insee de la commune	Libellé de la commune	Population de la commune	Nom de l'élu	Prénom de l'élu	Genre	Date de naissance	Code profession	Libellé de la profession	Age	Type profession
0	0	1	AIN	1	L'Abergement-Clémenciat	780	BOULON	Daniel	M	1951-03-04	61	Retraités salariés privés	67.482612	retraité
1	1	1	AIN	2	L'Abergement-de-Varey	234	ORSET	Max	M	1947-11-02	65	Autres retraités	70.817383	retraité
2	2	1	AIN	4	Ambérieu-en-Bugey	13839	FABRE	Daniel	M	1961-09-07	51	Cadres (entreprises publiques)	56.969050	entrep. publique
3	3	1	AIN	5	Ambérieux-en-Dombes	1600	PERNET	Pierre	M	1961-07-29	42	Professeurs du secondaire et techn.	57.078566	enseignement
4	4	1	AIN	6	Ambléon	112	BIONDA	Annie	F	1951-11-28	63	Retraités fonct.publique (sf enseig.)	66.746115	retraité

Références¶

Rendu graphique¶

Des données pour faire de beaux graphiques¶

Présentation des données¶

Une simple courbe¶

Distribution des données¶

Corrélation globale de N champs 2 à 2¶

Afficher les valeurs de différentes catégories¶

Courbe de niveaux¶

Statistiques¶

Moyenne et quartiles¶

Plus¶