Warsztaty CDO Forum 2025

Praktyczne vademecum jakości danych

Warsztaty prowadzone w formule onsite, w dniu poprzedzającym konferecję, dla ograniczonej grupy osób (do 20 uczestników max – decyduje kolejność zgłoszeń!)

 

Warsztaty przygotują uczestników do samodzielnej analizy jakości danych i poprawy błędów zgodnie z najlepszymi praktykami.

Problemy z jakością danych to temat, który zazwyczaj znajduje się na pierwszym miejscu każdej ankiety w pytaniu o wyzwania i problemy do rozwiązania - prowadzonej wśród osób zajmujących się zawodowo danymi. W praktyce widać, jak wiele projektów analitycznych lub AI ma problemy na poziomie wdrożenia i uzyskania dodatniego ROI właśnie z powodu niepoprawnych danych. Zastosowanie praktyk analizy jakości danych na wczesnym etapie każdego projektu pomoże w zaadresowaniu problemów na jak najwcześniejszym etapie. Jest dzisiaj warunkiem koniecznym racjonalnego działania organizacji biznesowych.

4 czerwca 2025, godz. 12.00

Onsite, Warszawa

Formuła

Warsztaty będą miały część wykładową i praktyczne ćwiczenia.

W pierwszej części zajdziecie: podstawowe terminy, typy wymiarów jakości danych takich jak kompletność (completeness) lub terminowość (timeliness), oraz procesy profilowania i reagowania na błędy.

W części drugiej: uczestnicy będą mogli przeprowadzić profilowanie i analizę jakościową przygotowanego pliku na swoich własnych komputerach. Ćwiczenia praktyczne zostaną przeprowadzone na narzędziach typu Open Source.

Korzyści dla uczestnika

Dzięki udziałowi w warsztach uzyskasz:

  • Lepsze zrozumienie, na czym polega analiza jakości danych
  • Umiejętność do odkrywania najczęstsze błędy w danych, których wykrycie daje największą wartość
  • Wiedzę, jak profilować dane, żeby przedstawić sponsorom biznesowym raport jakości danych i zagwarantować finansowanie dla procesów jakości danych
  • Sposoby zabezpieczania platformy danych przed ładowaniem niepoprawnych danych, poprzez wdrażanie praktyki "Shift-Left"
  • Podpowiedzi, jak zmierzyć jakość danych za pomocą metryk KPI, aby identyfikować najbardziej niestabilne źródła danych lub udowodnić poprawę jakości danych
  • Wskazówki, jakie stosować metody obserwacji danych do automatycznego wykrywania problemów oraz niestabilności procesów ładowania danych
  • Wiedzę, jak wykryć różnicę między danymi testowanymi oraz referencyjnymi, na przykład podczas migracji między bazami danych
  • Sugestie, w jakich obszarach warto używać AI do monitorowania jakości danych mając gwarancję sukcesu we wczesnym przewidywaniu problemów jakościowych

Wymagania – co jest potrzebne, aby w pełni uczestniczyć w warsztatach?

Warsztat przeznaczony jest dla osób posiadających przynajmniej podstawowe doświadczenie w analizie lub przetwarzaniu danych, czyli posiadanie podstawowej wiedzy z zakresu pisania zapytań SQL. Ponieważ warsztaty uwzględniają również etap praktyczny, uczestnicy powinni przynieść swoje laptopy, na których wcześniej należy pobrać i zainstalować oprogramowanie:

  • Laptop powinien mieć przynajmniej 16 GB RAM, system operacyjny obojętny: Windows/Linux/MacOS. Tablety z systemem iOS lub Android nie są obsługiwane.
  • Przed warsztatami należy zainstalować oraz raz uruchomić narzędzie DQOps zgodnie z opisem na stronie: https://dqops.com/docs/getting-started/installation/.
  • Nie jest potrzebna instalacja żadnych baz danych, ponieważ na czas warsztatu organizator przygotuje i udostępni stosowne tabele i pliki testowe.

Organizator zaleca pobranie i uruchomienie narzędzia DQOps przed warsztatami w domu, ponieważ cała platforma razem ze sterownikami do baz danych wymaga pobrania paczki o rozmiarze ponad 0.5 GB, co może być problemem dla hotelowej sieci WiFi podczas konferencji.

Agenda

12:00 - 12:30 Wprowadzenie do analizy jakości danych
12:30 - 13:30 Wymiary jakości danych oraz podstawowe typy błędów
13:30 - 14:00 Proces profilowania danych i porównywania między bazami danych
14:00 - 14:30 Integracja analizy jakości danych w procesach ładowania danych oraz stosowanie kontraktów (Data Contracts)
14:30 - 15:00 Mierzenie jakości danych w czasie za pomocą metryk KPI i personalizowanych dashboardów
15:00 - 15:30 Obserwacja danych z użyciem algorytmów AI
15:30 - 16:00 Procesy reagowania na błędy oraz ulepszania jakości danych zgodne z metodologią Agile
16:00 - 17:00 Ćwiczenia praktyczne - profilowanie i analiza przygotowanego zbioru danych

W trakcie warsztatów przewidziane są także przerwy.

Limit uczestników

20 osób, decyduje kolejność zgłoszeń

Prowadzenie

Founder
DQOps

Udział w warsztatach dodatkowo płatny.

PROMOCJA
do 16.05.2025

CENA
od 17.05.2025

Cena udziału 1 osoby w dodatkowych warsztatach onsite, 4.06.2025

890*
PLN NETTO

990*
PLN NETTO