Looking for 222-2-23 - Data scraping et wrangling test answers and solutions? Browse our comprehensive collection of verified answers for 222-2-23 - Data scraping et wrangling at moodle.univ-lr.fr.
Get instant access to accurate answers and detailed explanations for your course questions. Our community-driven platform helps students succeed!
Calculer la proportion de lignes supprimées au total depuis le début de la recette (indiquez juste le pourcentage sans décimale et sans le signe %).
Modifier les types des colonnes endowment (mettre double pour convertir automatiquement les valeurs en notation scientifique du type 6.2E7) et numStudents (mettre int32) puis supprimer toutes les lignes incorrectes.
On notera que le système de correction de type va tenter de vous faire plaisir. Ainsi si un cellule contient :
En clair il regarde si la cellule commence par un chiffre et tant qu'il en trouve il les conserve.
Combien reste-t-il de lignes ?
Inspectez les données pour identifier les problèmes puis cochez les cases qui correspondent à ce que vous avez trouvé.
Supprimez toutes les lignes qui contiennent des attributs vides ou null. Combien de lignes ont été supprimées ?
Combien de colonnes sont utiles pour notre étude (relisez l'objectif de l'étude en cas de doute) ? On ne garde rien de plus que ce qui est vraiment nécessaire.
Qu'est-ce que le data wrangling ?