Dlaczego „Calling Bullshit” jest ważną lekturą w czasach prania informacji
Dezinformacja i dezinformacja stały się tak wszechobecne w świecie opartym na danych, że obowiązkiem każdego obywatela jest bycie sceptycznym i wywoływanie tego

Ta wciągająca książka, która informuje, że liczby nie mówią same za siebie tak, jak reklamowano, ale są podrasowane, ukaże się w najbliższy wtorek. Ale wydawcy powinni byli spieszyć się z prasą kilka miesięcy temu, kiedy wybuchła pandemia i wykresy oparte na wątpliwych danych, przedstawiające postęp choroby, całkowity nieład w reakcji na zdrowie publiczne, szanse, że zostaniesz zarażony i szczupła podzbiór szansy, że umrzesz, zaczął pojawiać się codziennie na pierwszych stronach gazet. Konteksty ciągle się zmieniały, wnioski niezawodnie odmienne i zjednoczone jedynie w zdolności nakłaniania do utraty wiary w dane. West i Bergstrom, którzy wykładają informatykę na Uniwersytecie Waszyngtońskim, przypominają nam, że wiara to stary kapelusz. Aby wiedzieć, co dokładnie się dzieje, musisz być w stanie samodzielnie ocenić dane i ich manipulację. To zaskakująco łatwe.
Kiedy byliśmy w liceum, statystyki i prawdopodobieństwo były traktowane jako niedokładne pola matematyczne, które opierają się na wartości p, która jest często manipulowana standardem. Jeśli nie chciałeś studiować ekonomii i zwiedzać świata, nie traciłeś na to czasu. Średnia, mediana, tryb, odchylenie standardowe, permutacje i kombinacje, rytualny ukłon w stronę Pascala i ruszyłeś dalej. Do algebry Boole'a, jeśli fascynowały cię komputery, do trygonometrii i rachunku różniczkowego we wszystkim innym. Kto by pomyślał, że statystyka okaże się najważniejszą umiejętnością zrozumienia, co się dzieje w ludzkich sprawach?
W dobie Big Data i uczenia maszynowego problem wydaje się być spotęgowany przez samą wielkość zbiorów danych i nieodgadnioną liczbę algorytmów. Ruch szuka przejrzystości w algorytmach — jeśli komputer pominął Cię, powinieneś wiedzieć dlaczego — ale cel jest łatwiejszy do określenia niż do osiągnięcia. Uczenie maszynowe jest szkolone na zestawach danych, które są klasyfikowane przez ludzi, i tworzy program do kategoryzacji przyszłych danych. Ale nawet autorzy systemu mogą nie wiedzieć dokładnie, jak to działa. Książka odnosi się do systemu ML, którego zadaniem jest oddzielanie zdjęć husky i wilków. Ale patrzyło na tło, a nie na zwierzęta. Sztuczna inteligencja zdała sobie sprawę, że chociaż husky mogą być fotografowane w różnych ludzkich kontekstach, dzikie wilki są najprawdopodobniej fotografowane na tle śniegu. Patrzył tylko na tło i fałszywie, ale dokładnie identyfikował zwierzęta.
Poza tym większość algorytmów jest zastrzeżona, nie bez powodu. Gdyby Google opublikowało swój algorytm rankingowy publicznie, wywołałoby to globalny wyścig zbrojeń, ponieważ wszyscy i ich nastoletni siostrzeniec próbowaliby go oszukać. Ale autorzy przypominają nam, że generalnie nie trzeba wspinać się do czarnej skrzynki, w której żyje algo. Analiza jakości danych wejściowych i wyjściowych wymaga jedynie prostej logiki i służy temu celowi.
Wróćmy do koronawirusa, zawijasów i diagramów na pierwszej stronie oraz w objaśnieniach mapujących jego niszczycielską podróż przez rasę ludzką. Aby uzyskać dziką niespójność, rozważ dziwaczną klęskę związaną z potrzebą masek, z opiniami wahającymi się, jak zamiatanie wycieraczki przedniej szyby, między ich całkowitą bezużytecznością a ich krytyczną rolą w powstrzymywaniu. Co najbardziej żenujące, WHO, która zawsze rozsądnie wyznaczała globalny program, podsycała niepewność, podkopując zaufanie publiczne do autoryzowanej wersji i wiarygodności samej nauki.
A potem było to farrago (tempo Tharoor) wykresów, wykresów i wizualizacji danych. Tutaj również autorzy oferują proste kontrole. Czy skala zaczyna się od zera, punktu początkowego perspektywy, czy arbitralnej liczby, która wygodnie podkręca pozorne wyniki? Czy skala jest liniowa, czy też 1 cm oznacza pierwszy rok, a 10 lat później, krzywe strome? Czy skala czasu jest pomniejszona do tego stopnia, że krytyczne zmiany stają się niewidoczne? Autorzy usilnie sprzeciwiają się seksowaniu reprezentacji graficznych, na przykład poprzez zilustrowanie historii od farmy do rozwidlenia za pomocą zębów widelca, poza skalą, do reprezentowania danych. Ludzie są bardzo wizualnymi zwierzętami, a poprawianie wykresu jest najłatwiejszym sposobem na sprowadzenie ich na manowce.
W książce rozróżnia się staroświeckie BS, które tylko sprawia wrażenie, że robi się coś poważnie z czymś, co poważnie cię niepokoi (w Indiach lat 80. natychmiastowa realizacja planu działań na gruncie wojennym, pod bezpośrednim nadzorem wysokiej komisja pod przewodnictwem emerytowanego sędziego Sądu Najwyższego) oraz nowa szkoła BS, która używa języka matematyki, nauk ścisłych i statystyki, aby stworzyć wrażenie dyscypliny i dokładności. Jest tak wszechobecna, że wywoływanie jej w sposób odpowiedzialny musi stać się obowiązkiem publicznym.
Odbiorcy propagandy wierzą w to pierwsze tylko wtedy, gdy są do tego skłonni politycznie, ale wobec drugiego są bezradni. Gatunek uważa, że jest zagrożony liczebnie i nikczemnie poddaje się, gdy zostanie skonfrontowany z danymi, bez względu na to, jak ewidentnie mogą one być fałszywe lub mylące. Niestety liczby nigdy nie mówiły same za siebie. Teraz wypaczone dane stały się tak wszechobecne, że sprawdzacze faktów, nieugięci Galowie ery informacji, nie mogą już samodzielnie powstrzymać fali. Nadszedł czas, abyśmy wszyscy przeszli do cyfrowego ploggingu.
Podziel Się Z Przyjaciółmi: