✅ The verified answer to this question is available below. Our community-reviewed solutions help you understand the material better.
La première phase de nettoyage (suppression des valeurs nulles et des valeurs dont le type est incorrect) était à la fois incomplète sur certains points et supprimait trop d'informations sur d'autres. Nous allons donc recommencer le nettoyage mais pour de vrai. A partir de maintenant tout est un peu moins guidé mais des mots-clés permettent de trouver comment réaliser la plupart des étapes.
Reprendre le fichier initial, et réappliquer le workflow pour supprimer les colonnes inutiles et les lignes avec des champs vides mais sans modifier les types pour éviter de détruire des données. Il doit rester 55774 lignes.
Vous avez probablement remarqué qu'il y a de nombreuses lignes similaires. On va donc supprimer toutes les lignes dupliquées pour alléger un peu les analyses ultérieures. Combien reste-t-il de lignes ?Malgré ces modifications il reste de nombreuses redondances, par exemple "Aarhus University" contient plusieurs lignes. Combien pour cette université ?
On va dans la suite résoudre certains des problèmes au fur et à mesure.
Get Unlimited Answers To Exam Questions - Install Crowdly Extension Now!