Add to Chrome
✅ The verified answer to this question is available below. Our community-reviewed solutions help you understand the material better.
Welche der folgenden Aussagen zu Data Leakage sind korrekt?
Durch die Verwendung einer Pipeline wird Data Leakage unwahrscheinlicher.
Von Data Leakage spricht man, wenn Informationen aus den Testdaten versehentlich oder ungewollt in das Trainingsmodell gelangen.
Die fit()-Methode sollte immer auf allen Daten (Test- und Trainingsdaten) angewendet werden, um Data Leakage zu vermeiden.
fit()
Wenn bei Verwendung einer Kreuzvalidierung in jedem Durchlauf zwar das Modell neu auf den jeweiligen Trainingsdaten trainiert wird, aber die Vorverarbeitungsschritte bereits vorher auf dem Gesamtdatensatz durchgeführt wurden, tritt Data Leakage auf.
Get Unlimited Answers To Exam Questions - Install Crowdly Extension Now!