logo

Crowdly

Nettoyage de la colonne endowment ( durée prévue : 40 à 50mn, barème : 3pt ) C...

✅ The verified answer to this question is available below. Our community-reviewed solutions help you understand the material better.

Nettoyage de la colonne endowment (durée prévue : 40 à 50mn, barème : 3pt)

C'est l'une des pires (sinon la pire) colonne en termes de problèmes, notamment :

  • Certaines valeurs ne sont pas remplies (elles valent N/A)
  • Certaines valeurs n'ont aucun sens (--02--29)
  • Certaines valeurs pourraient avoir un sens en US$ mais sont exprimées incorrectement (US$3 million, $22.5M, etc.)
  • Certaines valeurs sont indiquées avec des virgules (séparateur de milliers en anglais mais qui bloque l'interprétation si on change le type)
  • Certaines valeurs pourraient avoir un sens dans d'autres devises

Mettez le type en Double et filtrez les données pour ne garder que les valeurs incorrectes. Combien de valeurs sont perdues si on faisait cette opération ?

Annulez le changement de type.

On se propose de corriger certains de ces problèmes même si de manière générale c'est compliqué de tout régler c'est la raison pour laquelle on supprime parfois.

  • Les valeurs en notation scientifique, telles que 5.27E9, seront correctement interprétées dans le type double donc on n'y touche pas (on peut même transformer d'autres valeurs dans ce format)
  • On va supprimer les informations sur la devise pour les US$ : supprimer tous les US$, U.S.$, US $ et autres qui se trouvent dans la colonne (attention à ne pas toucher aux autres devises).
  • Observer comment sont stockées les valeurs de millions et milliards dans les données correctes. Cela devrait vous permettre de corriger simplement toutes les lignes qui contiennent million, billion (avec et sans majuscules). N'oubliez pas que vous faites un workflow donc il est facile de revenir en arrière si vous avez fait une erreur...
  • Corriger les virgules utilisées comme séparateur de milliers s'il y en a (il suffit de les supprimer)
  • Optionnel : si vous voyez d'autres erreurs que vous pensez pouvoir modifier, corrigez-les mais assurez-vous que vos corrections sont pertinentes. Pensez à les commenter pour que ce soit clair.
  • Une fois que c'est terminé, passez le type en double et supprimez toutes les lignes pour lesquelles vous ne pensez rien pouvoir faire.

NB :

- Dans le fichier pdf expliquez ce que vous faites pour chaque correction (une phrase ou deux + une capture de la configuration de l'outil si cela vous semble nécessaire).

- La réponse à remplir n'est pas notée donc ce n'est pas grave si vous n'avez pas la bonne valeur !

More questions like this

Want instant access to all verified answers on moodle.univ-lr.fr?

Get Unlimited Answers To Exam Questions - Install Crowdly Extension Now!