Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
Welche der folgenden Aussagen zu Data Leakage sind korrekt?
Durch die Verwendung einer Pipeline wird Data Leakage unwahrscheinlicher.
Von Data Leakage spricht man, wenn Informationen aus den Testdaten versehentlich oder ungewollt in das Trainingsmodell gelangen.
Die fit()-Methode sollte immer auf allen Daten (Test- und Trainingsdaten) angewendet werden, um Data Leakage zu vermeiden.
fit()
Wenn bei Verwendung einer Kreuzvalidierung in jedem Durchlauf zwar das Modell neu auf den jeweiligen Trainingsdaten trainiert wird, aber die Vorverarbeitungsschritte bereits vorher auf dem Gesamtdatensatz durchgeführt wurden, tritt Data Leakage auf.
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!