Walidacja modeli statystycznych: teoria i praktyka

Kiedy?

piątek, 19 wrzesień 2025 10:00 - 13:00

Aby dokonać rezerwacji, zaloguj się lub zarejestruj konto.

Opis projektu

Warsztat poświęcony jest kompleksowemu omówieniu zagadnień związanych z walidacją modeli statystycznych i predykcyjnych w kontekście poprawności metodologicznej. Uczestnicy zostaną zapoznani z pełnym procesem analizy danych – od etapu ich przygotowania, poprzez konstrukcję modelu, aż po jego ocenę. Szczególny nacisk zostanie położony na zachowanie właściwej kolejności etapów analizy oraz przeciwdziałanie zjawisku przecieku danych (ang. data leakage), które może znacząco obniżyć wiarygodność uzyskanych wyników, a także prowadzić do zawyżonej oceny modelu.

Uczestnicy warsztatu zostaną zaznajomieni z podstawowymi technikami wstępnego przetwarzania danych, obejmującymi normalizację zmiennych, eliminację duplikatów oraz identyfikację wartości odstających. Przedstawione zostaną także metody imputacji danych – od podstawowych rozwiązań, takich jak zastępowanie wartości średnią lub dominantą, po zaawansowane techniki wykorzystujące modele predykcyjne. Kolejnym omawianym zagadnieniem będzie problem niezbalansowanych danych, wynikający z nierównej liczebności kategorii zmiennej zależnej. Uczestnicy poznają wybrane techniki balansowania zbioru, mające na celu poprawę skuteczności modeli klasyfikacyjnych. Istotnym elementem warsztatu będzie także inżyniera cech – proces tworzenia nowych zmiennych oraz ich transformacji w celu poprawy skuteczności modeli predykcyjnych. Dodatkowo, przedstawione zostaną metody selekcji cech (filtracyjne, wrapperowe, osadzone) mające na celu identyfikację najbardziej informatywnych zmiennych. W części poświęconej konstrukcji modeli przedstawione zostaną zagadnienia związane z dostrajaniem hiperparametrów, uwzględniając integrację tych technik z walidacją krzyżową. Ostatnia część warsztatu poświęcona będzie szczegółowej analizie metod ewaluacji modeli, obejmującej dobór adekwatnych miar oceny w kontekście zarówno zadań klasyfikacyjnych, jak i regresyjnych.

Warsztat adresowany jest przede wszystkim do osób posiadających podstawowe doświadczenie w analizie danych oraz modelowaniu statystycznym – w szczególności do analityków danych, badaczy, studentów kierunków ścisłych i technicznych, a także praktyków zainteresowanych tworzeniem rzetelnych, przejrzystych i poprawnie zwalidowanych modeli predykcyjnych. Zajęcia mają charakter praktyczny, a omawiane techniki będą ilustrowane przykładami implementacyjnymi z wykorzystaniem języka programowania R.