Aller au-dela de value_counts () : creer des tableaux de frequences visuellement attrayants avec seulement 3 lignes de code (a l’assistance de precisions OkCupid)
Quelques astuces simples mais indispensables que vous ne connaissiez probablement gui?re
Bien que le possible le plus facile de coder une table de frequences Afin de votre objet Series dans la bibliotheque Python pandas consiste a appliquer la value_counts() methode, le resultat de une telle operation parai®t plutot basique. Nous pouvons le rendre plus informatif en ajustant nos parametres booleens de la methode normalize , sort , ascending , et dropna , ou en regroupant des valeurs (si elles seront numeriques) dans des bacs. Cependant, les laternatives ici seront assez limitees, donc Afin de ameliorer visuellement la table de frequences resultante, nous pouvons envisager deux astuces simples mais utiles, telles que le chainage de methodes, la personnalisation du texte, l’ajout du % symbole a chaque valeur de frequence et l’utilisation de la puissance de jolie- impression.
Dans Cet article, nous allons experimenter un ensemble de donnees Kaggle contenant des renseignements sur l’age, le sexe, l’emplacement, l’education, etc., Afin de 60 000 utilisateurs de l’ application de rencontres OkCupid ??. Pour nos besoins, cependant, nous n’utiliserons que nos donnees i propos des statuts des utilisateurs.
1. Enchainement des methodes
Pour commencer, creons un tableau de frequence de base pour nos statuts des utilisateurs :
( Note : ci-apres, nous allons laisser l’ensemble des autres parametres d’la value_counts() technique via defaut, et cela signifie que nous ne considererons que les tableaux de frequences tries avec ordre decroissant et en excluant les valeurs manquantes. Read more