Wybrane problemy metodologiczne badań reprezentacyjnych
Opracowanie redakcyjne: Jan Kordos, Jolanta Pawłowska, Jadwiga Rybacka
Biblioteka Wiadomości Statystycznych, tom 15
Główny Urząd Statystyczny, Warszawa 1971
Statystyka kompromisu
Badania statystyczne mają szczególny charakter. Muszą nie tylko spełniać wszystkie wymogi stawiane przedsięwzięciom naukowym i dostarczać rzetelnych i trafnych wyników, lecz także odpowiadać na potrzeby użytkowników danych. W PRL tymi użytkownikami byli najczęściej decydenci polityczni. Statystycy byli zmuszeni szukać kompromisu pomiędzy wygórowanymi oczekiwaniami władz a wymogiem przeprowadzania badań bez znacznego wzrostu ich kosztów.
Statystyka jako nauka powinna być bezstronna i obiektywna, a w każdym razie dążyć do tych ideałów. W konsekwencji badania statystyczne powinny służyć poznaniu naukowemu tych cech rzeczywistości, które są możliwe do uchwycenia ilościowego. W praktyce jednak żadna nauka nie jest podporządkowana tylko obiektywnemu poznaniu i zrozumieniu świata, a badacze nie mają tak komfortowych warunków, żeby oddać się wyłącznie wzniosłym celom naukowym. Pod uwagę trzeba brać wiele ograniczeń instytucjonalnych, technicznych, czasowych, politycznych, czy po prostu ludzkich. Weźmy przykład dendrolożki, która chciałaby badać przebieg życia dębu szypułkowego. Jej koleżanki briolożki, które zajmują się cyklem życia różnych gatunków torfowca, mają problem ze zdobyciem grantu na odpowiednio długi okres – torfowce mogą żyć i 10 lat, a granty przyznaje się zwykle na 3–4 lata – ale przy odrobinie szczęścia mogą po latach obserwacji wybranych osobników przejść do analizy zgromadzonych informacji. Tylko że dąb szypułkowy potrafi przeżyć 1000 lat! Żaden badacz, ani nawet zespół badaczy, nie ma najmniejszych szans, by zaobserwować pełny cykl rozwojowy osobnika tak długowiecznego gatunku.
Statystycy wprawdzie nie mają tego rodzaju kłopotów, za to mierzą się z innymi. Szczególnie kiedy rzecz dotyczy statystyki publicznej, a więc nauki podporządkowanej celom nie tylko naukowym. Statystyka publiczna ma charakter oficjalnej, ogólnodostępnej wiedzy, legitymizowanej autorytetem najwyższych urzędów, co odróżnia ją od rozmaitych partykularnych projektów badawczych, prowadzonych przez naukowców, którzy mogą kierować się swoją pasją przy wyborze tematu badawczego. Przymiotnik „publiczna” konotuje coś jeszcze: rolę służebną wobec publiczności złożonej z najróżniejszych podmiotów, których zapotrzebowanie na informacje statystyka publiczna ma zaspokajać. Statystyka jest więc publiczna także w tym sensie, że stanowi rzecz publiczną, dobro wspólne. Ten aspekt zdecydowanie zwiększa stawiane jej wymagania.
W PRL statystykę nieprzypadkowo nazywano raczej państwową niż publiczną, ponieważ bardziej niż szerokim rzeszom publiczności była ona podporządkowana interesom polityczno-gospodarczym państwa. Nie znaczy to bynajmniej, że badania były tendencyjne, a wyniki – zmanipulowane. Choć rozwój różnych obszarów badań statystycznych był wysoce nierówny, a praktyka niejednokrotnie nie nadążała za teorią – albo po prostu podążała innymi drogami – to nie rzutowało to na skrupulatność prowadzonych badań ani na trafność i rzetelność publikowanych informacji. Oznaczało jednak, że w praktyce badawczej trzeba było uwzględnić – i to już na etapie formułowania metodologii – zarówno ograniczenia finansowe, techniczne i inne, jak i oczekiwania rządzących, którzy wymagali od statystyki publicznej dostarczenia takich danych, które, ich zdaniem, były niezbędne do planowania rozwoju społeczno-gospodarczego.
Te dodatkowe ograniczenia, dotyczące nawet metodologii, w statystyce państwowej podkreślał wielokrotnie Jan Kordos w referacie Możliwości szerszego stosowania metody reprezentacyjnej w badaniach statystycznych krajów-członków RWPG, którego zapis otwiera publikację pokonferencyjną Wybrane problemy metodologiczne badań reprezentacyjnych z 1971 r., stanowiącą 15 tom serii Biblioteka Wiadomości Statystycznych. Już w pierwszym akapicie Kordos wskazywał, że wzrost zapotrzebowania na informacje statystyczne zmusza do poszukiwań takich metod zbierania danych, które „powinny zapewnić uzyskanie żądanych informacji w krótkim czasie, a przy tym zebranych niewielkim nakładem pracy i zgodnych z rzeczywistością” (s. 11). Autor rozwijał tę kwestię dalej i wskazywał zależność pomiędzy modernizacją statystyki a postępem w zarządzaniu gospodarczym:
Podobnie jak bez zmodernizowania statystyki nie jest możliwy postęp w kierowaniu i zarządzaniu gospodarką narodową, bez podniesienia jakości danych statystycznych nie jest możliwe uzyskanie zamierzonej jakości systemu i procesu planowania. Potrzebne są tu już nie tylko informacje w formie zagregowanej, w postaci prostych zestawień tabelarycznych, ale również informacje znacznie przetworzone przy zastosowaniu odpowiednich metod matematycznych i elektronicznej techniki obliczeniowej, a do tego celu niezbędne są informacje jednostkowe, tj. dotyczące poszczególnych jednostek badania. Informacje takie można wprawdzie uzyskać z badań wyczerpujących, ale często – ze względu na cel analizy – bardziej efektywna okazuje się metoda reprezentacyjna (s. 12).
Kordos dodawał, że informacje statystyczne powinny być dostarczane władzom szybko, żeby mogły być wykorzystane w bieżącym zarządzaniu. Powinny też być w jak najmniejszym stopniu obciążone różnymi błędami. W części poświęconej stricte problemom metodologicznym autor zauważał, że na pytanie „w jakich przypadkach badanie wyczerpujące można zastąpić badaniem reprezentacyjnym” nie sposób udzielić jednoznacznej odpowiedzi, ponieważ trzeba uwzględnić kilka warunków, „takich jak cel badania, dostępne środki finansowe, przedmiot badań itp.” (s. 15). Należało zatem postawić następne pytania, np. o to, czy badanie ma zebrać dane dla każdej jednostki, czy tylko dla ich grup lub całej zbiorowości.
Nie łatwiej było na etapie wyboru metody badania, ponieważ – jak zaznaczał Kordos – „chodzi o wybór takiego schematu, który daje żądane informacje o określonym stopniu precyzji przy najmniejszym koszcie badania lub odwrotnie”, innymi słowy – „o wybór, który dąży do najbardziej efektywnego rozdysponowania środków, czasami przez dążenie do najmniejszej liczebności próbki, częściej zaś przez minimalizację kosztu badania” (s. 17). Koszty (finansowe i inne) były więc nieustannie kładzione na szali obok innych czynników, które brano pod uwagę przy poszukiwaniach optymalnego schematu. Dodatkowy kłopot wiązał się z oczekiwanym stopniem precyzji rezultatów badania: określający go użytkownicy danych (czyli polityczni decydenci), zdaniem Kordosa, „nie zawsze myślą kategoriami statystycznymi. Dlatego w zasadzie podawane są zbyt wygórowane wymagania” co do poziomu dokąłdności wyników (s. 17).
Następnie pojawia się problem operatu losowania. Jak zaznacza autor, „w dotychczasowych badaniach niejednokrotnie brak było dobrych operatów losowania. Za operaty przyjmowano materiały gromadzone w celach administracyjnych w różnym czasie i przestrzeni. Operaty takie okazywały się często niekompletne i przestarzałe” (s. 18). W związku z czym badania trzeba było poprzedzić skompletowaniem odpowiednich materiałów do wylosowania próby badawczej. Ponadto wygórowane oczekiwania użytkowników danych skutkowały zwiększaniem minimalnej liczebności próby, a w konsekwencji rosnącymi kosztami badania. „Od stawiania rozsądnych wymagań dotyczących precyzji wyników zależy w dużym stopniu możliwość rozszerzenia zastosowań metody reprezentacyjnej w badaniach statystycznych” – konkludował Kordos (s. 19).
Badania statystyczne wymagały poszukiwania na każdym etapie kompromisu pomiędzy oczekiwaniami – zarówno użytkowników, jak i samych badaczy – a realnymi możliwościami. Nie inaczej było w kwestii wyboru schematu losowania, który wiązał się z określonymi kosztami i sprawami organizacyjnymi, a nie tylko technicznymi. „Toteż w praktyce statystycznej często zadowalano się schematami będącymi kompromisem między wymaganiami teorii, kosztem i organizacją badania. Zwykle w największym stopniu decydował koszt badania i możliwości organizacyjne” – podkreślał autor (s. 19). Kilka omówionych przez niego przykładów dobrze obrazuje, jak na każdym kroku badacze musieli brać pod uwagę różne cele, wymagania i okoliczności, żeby zaproponować kompromisowe rozwiązanie i przejść w końcu do zbierania danych.
Xawery Stańczyk
Publikację Wybrane problemy metodologiczne badań reprezentacyjnych (tom 15 serii monograficznej Biblioteka Wiadomości Statystycznych) można pobrać ze strony https://bws.stat.gov.pl/bws_15_Wybrane_problemy_metodologiczne_badan_reprezentacyjnych.
Więcej felietonów o archiwalnych tomach Biblioteki Wiadomości Statystycznych znajduje się pod adresem https://nauka.stat.gov.pl/Archiwum