Warsztaty prowadzone w formule onsite, w dniu poprzedzającym konferecję, dla ograniczonej grupy osób (do 20 uczestników max – decyduje kolejność zgłoszeń!)
Warsztaty przygotują uczestników do samodzielnej analizy jakości danych i poprawy błędów zgodnie z najlepszymi praktykami.
Problemy z jakością danych to temat, który zazwyczaj znajduje się na pierwszym miejscu każdej ankiety w pytaniu o wyzwania i problemy do rozwiązania - prowadzonej wśród osób zajmujących się zawodowo danymi. W praktyce widać, jak wiele projektów analitycznych lub AI ma problemy na poziomie wdrożenia i uzyskania dodatniego ROI właśnie z powodu niepoprawnych danych. Zastosowanie praktyk analizy jakości danych na wczesnym etapie każdego projektu pomoże w zaadresowaniu problemów na jak najwcześniejszym etapie. Jest dzisiaj warunkiem koniecznym racjonalnego działania organizacji biznesowych.
Warsztaty będą miały część wykładową i praktyczne ćwiczenia.
W pierwszej części zajdziecie: podstawowe terminy, typy wymiarów jakości danych takich jak kompletność (completeness) lub terminowość (timeliness), oraz procesy profilowania i reagowania na błędy.
W części drugiej: uczestnicy będą mogli przeprowadzić profilowanie i analizę jakościową przygotowanego pliku na swoich własnych komputerach. Ćwiczenia praktyczne zostaną przeprowadzone na narzędziach typu Open Source.
Dzięki udziałowi w warsztach uzyskasz:
Warsztat przeznaczony jest dla osób posiadających przynajmniej podstawowe doświadczenie w analizie lub przetwarzaniu danych, czyli posiadanie podstawowej wiedzy z zakresu pisania zapytań SQL. Ponieważ warsztaty uwzględniają również etap praktyczny, uczestnicy powinni przynieść swoje laptopy, na których wcześniej należy pobrać i zainstalować oprogramowanie:
Organizator zaleca pobranie i uruchomienie narzędzia DQOps przed warsztatami w domu, ponieważ cała platforma razem ze sterownikami do baz danych wymaga pobrania paczki o rozmiarze ponad 0.5 GB, co może być problemem dla hotelowej sieci WiFi podczas konferencji.
12:00 - 12:30 | Wprowadzenie do analizy jakości danych |
12:30 - 13:30 | Wymiary jakości danych oraz podstawowe typy błędów |
13:30 - 14:00 | Proces profilowania danych i porównywania między bazami danych |
14:00 - 14:30 | Integracja analizy jakości danych w procesach ładowania danych oraz stosowanie kontraktów (Data Contracts) |
14:30 - 15:00 | Mierzenie jakości danych w czasie za pomocą metryk KPI i personalizowanych dashboardów |
15:00 - 15:30 | Obserwacja danych z użyciem algorytmów AI |
15:30 - 16:00 | Procesy reagowania na błędy oraz ulepszania jakości danych zgodne z metodologią Agile |
16:00 - 17:00 | Ćwiczenia praktyczne - profilowanie i analiza przygotowanego zbioru danych |
W trakcie warsztatów przewidziane są także przerwy.
20 osób, decyduje kolejność zgłoszeń
PROMOCJA
do 16.05.2025
CENA
od 17.05.2025