68/99 - Dane w 90% poprawne to dane bezużyteczne. O paradoksie zaufania do AI. Vadim Makarenko.
Update: 2025-08-17
Description
Zanim świat oszalał na punkcie modeli językowych, praca z danymi była domeną dla cierpliwych. Vadim Makarenko, który tworzył pierwszy w Polsce redakcyjny dział danych, zabiera nas do czasów, gdy wyciągnięcie informacji z pliku PDF było pracochłonnym zadaniem, a analiza ogromnych zbiorów przypominała pracę detektywistyczną.
Kulminacją tego podejścia było śledztwo Panama Papers – gigantyczny, nieustrukturyzowany zbiór danych, w którym trzeba było znaleźć polskie wątki. Jak sam wspomina: "To jest bardzo trafna metafora, że to jest po prostu albo hałda węgla, albo ogromna kupa siana i po prostu z tego siana my musimy coś wyciągnąć. Nieustająco w nim grzebiemy, zanim się czegoś złapiemy".
Ta opowieść doskonale pokazuje, jak bardzo zmieniły się narzędzia, ale też jak fundamentalne pozostały ciekawość i umiejętność nieszablonowego myślenia.
Posłuchajcie sami!
Kulminacją tego podejścia było śledztwo Panama Papers – gigantyczny, nieustrukturyzowany zbiór danych, w którym trzeba było znaleźć polskie wątki. Jak sam wspomina: "To jest bardzo trafna metafora, że to jest po prostu albo hałda węgla, albo ogromna kupa siana i po prostu z tego siana my musimy coś wyciągnąć. Nieustająco w nim grzebiemy, zanim się czegoś złapiemy".
Ta opowieść doskonale pokazuje, jak bardzo zmieniły się narzędzia, ale też jak fundamentalne pozostały ciekawość i umiejętność nieszablonowego myślenia.
Posłuchajcie sami!
Comments
In Channel