Okładka monografi - Problemy badań statystycznych metodą reprezentacyjną

Problemy badań statystycznych metodą reprezentacyjną
Opracowanie merytoryczne: Ryszard Zasępa
Biblioteka Wiadomości Statystycznych, tom 36
Polskie Towarzystwo Statystyczne, Komitet Statystyki i Ekonometrii PAN, Główny Urząd Statystyczny, Warszawa 1989

Nauka i sztuka

Wydawać by się mogło, że trudniej o bardziej rygorystycznie naukową dyscyplinę niż statystyka. Jednak mimo rozwoju metod matematycznych i technologii informacyjnych w praktyce statystycznej końca XX w. ciągle niezbędne były cechy typowo humanistyczne: twórcze myślenie, intuicja i zdolność improwizacji.

W drugiej połowie XX w. polska statystyka publiczna – przez większą część tego czasu określana jako państwowa – przeszła znaczną ewolucję. Jednym z najbardziej znamiennych jej wyznaczników był, nasilony od lat 70 XX w., rozwój statystyki matematycznej. Obszarem, w którym rozwój ten szczególnie mocno wpływał na praktykę statystyczną, była metoda reprezentacyjna, stanowiąca temat 36. Tomu serii Biblioteka Wiadomości Statystycznych, wydanego w 1989 r. pod tytułem Problemy badań statystycznych metodą reprezentacyjną.

Prace nad wykorzystaniem metod matematycznych w praktyce statystycznej zaczęły się dużo wcześniej, kilka lat po wojnie. Przez długi czas toczyły się w ramach Komisji Matematycznej GUS, powołanej w 1949 r. pod przewodnictwem ówczesnego prezesa urzędu - Stefana Szulca. Wraz z powstaniem w 1965 r. przy GUS Zakładu Badań Statystyczno-Ekonomicznych tego typu opracowania aplikacyjne w znacznej mierze przeniesiono do tej nowej jednostki naukowej (choć Komisja Matematyczna działała jeszcze do początku lat 80. XX w.); nie przypadkiem tom 36 serii BWS powstał pod opieką merytoryczną Ryszarda Zasępy, profesora ZBSE. Rozwój metod matematycznych w statystyce przyspieszył, a GUS stał się ich liderem wśród urzędów statystycznych RWPG.

Rola GUS była tym ważniejsza, że wraz z upływem czasu coraz wyraźniej zarysowywał się rozdźwięk między doskonaleniem procedur statystyki matematycznej, którym zainteresowani byli badacze akademiccy, a realiami funkcjonowania urzędów statystycznych. Na przykład teoretycy metody reprezentacyjnej koncentrowali się zwykle na kwestiach wnioskowania na temat wartości globalnej jednej cechy, podczas gdy w praktyce badań reprezentacyjnych szacuje się różne charakterystyki wielu różnych cech. Co oczywiste dla praktyków, plan próbkowania probabilistycznego musi uwzględniać uwarunkowania techniczne, organizacyjne i finansowe – coś, od czego teoria może abstrahować. To, co w teorii jest optymalne, może być trudne do osiągnięcia w praktyce. Dlatego Zasępa stwierdzał w swoim artykule Teoria badań reprezentacyjnych i jej zastosowania w praktyce statystycznej, że „tzw. »niedopuszczalna« strategia może być w pewnych warunkach użyteczniejsza niż strategia »dopuszczalna«” (s. 19). Zasępa podawał przykład Narodowego Spisu Powszechnego z 1978 r., w którym zdecydowano się na systematyczne losowanie mieszkań z obwodów spisowych, a więc losowanie jednostopniowe warstwowe. Choć to rozwiązanie nie było optymalne w sensie teoretycznym (obwody nie były bardziej jednorodne wewnętrznie niż populacja), w praktyce było to najlepsze rozwiązanie. Z kolei w mikrospisie z 1984 r. zdecydowano się w przypadku wsi na losowanie zespołowe i warstwowe, w którym zespoły stanowiły obwody spisowe, a warstwy – województwa. Zasępa przyznawał, że dwustopniowy wybór próby byłby lepszy, ale organizatorzy obawiali się „niekorzystnego wpływu na spis rozproszenia próby w terenie, co mogło wywołać częstsze błędy obserwacji” (s. 19).

Podobne uwagi na temat rozdźwięku między teorią a praktyką wyrażali także inni autorzy omawianego tomu. Jan Steczkowski z Akademii Ekonomicznej w Krakowie w Kilku myślach o metodzie reprezentacyjnej w badaniach zjawisk społeczno-ekonomicznych przypominał, że zastosowanie statystyki matematycznej do badań społeczno-ekonomicznych wymaga uwzględnienia, obok zagadnień „wchodzących w zakres rozważań formalno-matematycznych”, również metodologii danej dyscypliny naukowej i specyfiki analizowanych zjawisk. Jak zauważał, stawia to praktyka statystyki w niełatwej sytuacji:

Rola statystyka, jako dostarczyciela metod badawczych, jest bardzo niewdzięczna. Z jednej strony bardzo często gromiony jest przez matematyków za brak pełnej poprawności formalnej w zakresie stosowanych procedur, z drugiej strony użytkownicy tych metod zarzucają statystykom abstrakcyjność proponowanych rozwiązań i w zbyt małym stopniu uwzględnianie specyfiki tej dziedziny wiedzy, w której metody statystyczne są stosowane. Te dwa rodzaje przekonań dostarczają sobie nawzajem argumentów, co do słuszności reprezentowanych postaw (s. 21).

Zastosowanie metody reprezentacyjnej uwidacznia ten problem szczególnie dobrze, ponieważ poszukiwanie jak najbardziej efektywnych estymatorów przez teoretyków prowadzi „do »swoistej matematyzacji« badań statystycznych, kończących się »de facto« na konstrukcji modelu matematycznego niezbyt spójnego z opisywaną przy jego pomocy rzeczywistością” (s. 21). Z drugiej strony Steczkowski odnotowywał przypisywanie statystyce słabości, które należą do dyscypliny badań, a metoda reprezentacyjna nie ma na nie wpływu. „Wymyślne estymatory”, jak ironicznie pisał o nich uczony, wymagały spełnienia tak wielu i tak mocnych założeń, że zastosowanie ich w naukach społeczno-ekonomicznych stawało się niemożliwe; stąd Steczkowski postulował sięgnięcie po „mniej skomplikowane, ale za to bardziej użyteczne narzędzia” (s. 25). Ten sam autor podkreślał paradoks: coraz bardziej wyrafinowane metody ilościowe i coraz bardziej efektywne komputery nie zdadzą się na wiele, jeśli trafią do nich niepełne, nierzetelne dane. Zwracał też uwagę na fakt, że propagowaniem i nauczaniem metody reprezentacyjnej w Polsce zajmował się głównie… GUS, a nie uczelnie ekonomiczne.

Tematykę wytwarzania danych podjął w tekście Konieczność uwzględniania błędów losowych i nielosowych w planowaniu badań reprezentacyjnych i wykorzystaniu ich wyników Jan Kordos, reprezentujący GUS i PTS. On także podkreślał, że „nie wystarczy uwzględnić, przy planowaniu badań statystycznych metodą reprezentacyjną, jedynie oczekiwanej precyzji ocen parametrów, ale także inne aspekty metodologiczne badań statystycznych”: od dostępności i przeszkolenia personelu po środki finansowe (s. 99). Wskazywał również na niezadowalający stan nauczania metody reprezentacyjnej na polskich uczelniach, przede wszystkim brak kompetentnych, doświadczonych nauczycieli. W rezultacie, mimo wysokiego poziomu prac teoretycznych niewielu statystyków było zainteresowanych możliwościami zastosowania metody reprezentacyjnej w praktyce; łatwiej było posiłkować się innymi metodami.

Kordos dostrzegał, że teoretyczny model badań reprezentacyjnych „ma niewiele wspólnego z problemami, występującymi w większości badań reprezentacyjnych” (s. 102), takimi jak koszty finansowe i ograniczenia techniczne. Nawet określenie głównego celu badań – od czego w teorii należałoby zacząć – bywało trudne w badaniach wieloprzedmiotowych i wielocelowych. Jak wskazywał, praktycznych przeszkód może być tak wiele, że ostateczny plan badań nie ma wiele wspólnego z optymalnym:

Tak więc w praktyce okazuje się, że większość badań reprezentacyjnych planuje się z niewielkim lub przy prawie żadnym uwzględnieniu metodologii optymalizacji, która została rozwinięta przez teoretyków badań reprezentacyjnych. […] końcowe decyzje są zwykle oparte na „wyczuciu” sytuacji, doświadczeniach z poprzednich badań oraz różnych ograniczeniach organizacyjnych, które limitują przyjęte rozwiązania. Tak więc w praktyce badania reprezentacyjne są tylko częściowo oparte na podstawach naukowych, a częściowo na innych zasadach, które można by zaliczyć raczej do sztuki niż nauki. W różnych opracowaniach o metodzie reprezentacyjnej można się spotkać z pytaniem, w jakim stopniu badania te zależą od nauki, a w jakim od sztuki? Nie ulega wątpliwości, że sztuka odgrywa tu ważną rolę (s. 103).

Łatwo się domyślić, że przez sztukę Kordos rozumiał nie twórczość o charakterze estetycznym, lecz swoisty kunszt, płynącą z doświadczenia zawodowego intuicję i kreatywne podejście do sytuacji, których nie uwzględniano w podręcznikach statystyki matematycznej. Wyposażony w wyrafinowane metody i najnowsze komputery statystyk końca XX w. musiał nadal w jakimś stopniu improwizować, rozwiązywać problemy na „wyczucie”, postępować bardziej jak artysta-rzemieślnik, niż matematyk. Zwłaszcza wtedy, gdy próbował odnieść metody matematyczne do świata społeczno-gospodarczego.

Xawery Stańczyk

Publikację Problemy badań statystycznych metodą reprezentacyjną(tom 36 serii monograficznej Biblioteka Wiadomości Statystycznych) można pobrać ze strony https://bws.stat.gov.pl/bws_36_problemy_badan_statystycznych_metoda_reprezentacyjna.

Więcej felietonów o archiwalnych tomach Biblioteki Wiadomości Statystycznych znajduje się pod adresem https://nauka.stat.gov.pl/Archiwum