Alimlər Statistika mövzusunda Aldanmağı necə Dayandıra bilər?

Dorothy Bishop-un maraqlı bir məqaləsi ortaya çıxdı təbiət 584: 9 (2020); doi: 10.1038 / d41586-020-02275-8

Simulyasiya edilmiş məlumatların toplanması bilişsel yanaşmalarımızın bizi yoldan çıxartmağın ümumi yollarını aşkar edə bilər.


Son on ildə sağlam və etibarlı tədqiqatları təşviq etmək üçün çox sayda səy göstərildi. Bəziləri, təşəbbüslərin dəyişdirilməsinə, məsələn, maliyyələşdirmə və nəşr meyarlarını dəyişdirərək, sensasiyalı irəliləyişlərdən daha çox açıq elmə üstünlük verməyə diqqət yetirirlər. Ancaq şəxsiyyətə də diqqət yetirilməlidir. Həddindən artıq insan bilişsel qərəzləri bizi olmayan nəticələri görməyə vadar edə bilər. Səhv mülahizələr niyyətlər yaxşı olsa belə, təmkinli elmə aparır.

Müəllif haqqında bir neçə söz:  

Professor Doroti Bishop


Eksperimental Psixologiya Bölümü, İnkişaf Nöropsikologiya professoru; St John Kollecinin üzvü


Professor Bishop uşaqlarda dil qüsurlarını araşdırır. Bəzi hallarda nitq çətinliklərinin eşitmə itkisi və ya Daun sindromu kimi bir vəziyyət kimi açıq bir səbəbi var. Digər hallarda, uşaqlar heç bir səbəb olmadan danışmağı və ya dili anlamaqda çətinlik çəkirlər. Professor Bishop, əhalinin təxminən 3% -ni təşkil edən, lakin tədqiqatçılar tərəfindən laqeyd qalma meylli "spesifik nitq qüsurları" ya da SLI olan uşaqları tədqiq etmişdir. İkiz tədqiqatlardan istifadə edərək, bu xəstəliklərin genetik komponentini araşdırdı və hansı genlərin iştirak etdiyini öyrənmək üçün molekulyar genetiklərlə çalışdı. Mənbə şəkli: Vikipedia


Alimlər Statistika mövzusunda Aldanmağı necə Dayandıra bilər?

Son on ildə sağlam və etibarlı tədqiqatları təşviq etmək üçün çox sayda səy göstərildi. Bəziləri, təşəbbüslərin dəyişdirilməsinə, məsələn, maliyyələşdirmə və nəşr meyarlarını dəyişdirərək, sensasiyalı irəliləyişlərdən daha çox açıq elmə üstünlük verməyə diqqət yetirirlər. Ancaq şəxsiyyətə də diqqət yetirilməlidir. Həddindən artıq insan bilişsel qərəzləri bizi olmayan nəticələri görməyə vadar edə bilər. Səhv mülahizələr niyyətlər yaxşı olsa belə, təmkinli elmə aparır.

Tədqiqatçıların bu tələlərin daha yaxşı bilinməsi lazımdır. Laboratoriya alimlərinin təhlükəsizlik təhsili olmadan təhlükəli maddələrlə qarşılaşmasına icazə verilmədiyi kimi, tədqiqatçıların bunun mənasını başa düşmədiklərini nümayiş etdirənə qədər P dəyəri və ya oxşar statistik ehtimal ölçüsü yaxınlığında bir yerə getməsinə icazə verilməməlidir.

Hamımız fikirlərimizə zidd olan dəlilləri görməməzlikdən gəlirik. Yeni məlumatlarla qarşılaşanda əvvəlcədən mövcud olan fikirlərimiz mövcud olmayan strukturları görməyimizə səbəb ola bilər. Bu, məlumat axtardığımız və düşündüklərimizə uyğun məlumatları xatırladığımız təsdiqləmə qərəzinin bir formasıdır. Uyğunlaşdırıla bilər: insanların təhlükəli vəziyyətdən çıxmaq üçün vacib məlumatları təmizləməsi və sürətlə hərəkət etmələri lazımdır. Ancaq bu filtrləmə elmi səhvlərə yol aça bilər.


1913-cü ildə fizik Robert Millikan tərəfindən elektronun yükünün ölçülməsi buna bir nümunədir. İşində məşhur yağ damlası təcrübəsindən alınan bütün məlumat nöqtələrini özündə birləşdirdiyini iddia etsə də, dəftərlərində son dəyəri yalnız bir qədər dəyişdirəcək, lakin ona daha böyük bir statistik səhv verəcək başqa, bildirilməmiş məlumat nöqtələri aşkar edildi. Millikanın oxucularını aldatmaq məqsədi daşıdığına dair mübahisələr oldu. Bununla birlikdə, dürüst insanların əlverişsiz faktlarla bağlı xatirələrini basdırması nadir deyil (RC Jennings Sci. Eng. Ethik 10, 639-653; 2004).

Digər bir məhdudiyyət növü, ehtimal və statistikada anlaşılmazlığı təşviq edir. İnsanların kiçik nümunələrlə əlaqəli qeyri-müəyyənliyi qavramaqda çətinlik çəkdiklərini çoxdan bilirik (A. Tversky və D. Kahneman Psychol. Bull. 76, 105-110; 1971). Mövcud bir nümunə olaraq, əhalinin 5% -nin bir virusa yoluxduğunu düşünək. Hər birimizdə 100 nəfəri test edən 25 xəstəxana, 100 nəfəri test edən 50 xəstəxana və 100 nəfəri test edən 100 xəstəxanamız var. Xəstəxanaların neçə faizi heç bir xəstəlik tapmayacaq və səhvən virusun getdiyi qənaətinə gələcək? Cavab 28 nəfəri müayinə edən xəstəxanaların 25% -i, 8 nəfəri müayinə edən xəstəxanaların 50% -i və 1 nəfəri müayinə edən xəstəxanaların 100% -i. Xəstəxanalar tərəfindən aşkarlanan orta xəstəlik sayı, test edilmiş saydan asılı olmayaraq eynidır, lakin kiçik bir nümunə ilə aralığı çoxdur.

Bu qeyri-xətti miqyasın intuitiv şəkildə qavranılması çətindir. Kiçik səsli nümunələrin nə qədər səs-küylü ola biləcəyini qiymətləndirməməyə və bu səbəbdən bir təsiri aşkar etmək üçün statistik gücdən məhrum olan tədqiqatların aparılmasına gətirib çıxarır.

Tədqiqatçılar, P dəyərində ifadə olunan bir nəticənin əhəmiyyətinin kritik olaraq kontekstdən asılı olduğunu anlamırlar. Dəyişənləri nə qədər çox araşdırsanız, səhv bir "əhəmiyyətli" dəyər tapmaq ehtimalı o qədər çoxdur. Məsələn, 14 metaboliti bir pozğunluqla əlaqəli bir test üçün test etsəniz, ən azı 0,05-dən aşağı bir P dəyəri tapmaq ehtimalı - çox istifadə olunan statistik əhəmiyyət həddidir - 1-də 20 deyil, 1-ə yaxındır 2-yə.

Bunu necə başa düşə bilərik? Bir şey aydındır: statistikada ənənəvi təlim qeyri-kafi və ya əks təsir göstərir, çünki istifadəçiyə yersiz inam verə bilər. Alternativ bir yanaşma ilə təcrübə aparıram: şagirdlərin müxtəlif statistik təhlillərə məruz qala biləcəyi süni məlumatlar yaratmaq. Bunu iki əsas konsepsiyanı çatdırmaq üçün istifadə edirəm.

Birincisi, tələbələrə təsadüfi qeydlər (təsadüfi rəqəmlər kimi) təqdim edildikdə, statistik olaraq "əhəmiyyətli" görünən yalan nəticələri tapmaq nə qədər asan olduğunu tez bir zamanda tapırlar. Tədqiqatçılar, "A B ilə əlaqələndirilirmi?" sualından "P <0,05 olan A, B, C, D və E dəyişənləri üçün korrelyasiya varmı? Müəyyən bir metabolitin bir xəstəliklə əlaqəli olub olmadığı sualı bir sıra aramaqla eyni deyil onunla əlaqəli olub olmadığını görmək üçün metabolitlər, ikincisi isə daha ciddi test tələb edir.

Təkrar istehsal olunmayan dörd atlını nəzarətdə saxlamaq

Süni məlumatlar, nümunələr müxtəlif vasitələrlə iki "populyasiyadan" gəldikdə də məlumat verir. Şagirdlər kiçik nümunə ölçüləri ilə bir təcrübənin orta bir fərqi ortaya çıxarmaq üçün faydasız ola biləcəyini tez bir zamanda öyrənirlər. 30 dəqiqəlik bir məlumat simulyasiyası tədqiqatçıları təsirlərini başa düşdükləri təqdirdə heyrətləndirə bilər.


Tədqiqatçılar təsdiqləyici qərəzlərlə aldanmamaq üçün ömürlük vərdişlər qazanmalıdırlar. Gözlədiklərimizə zidd olan müşahidələr xüsusi diqqət tələb edir. Çarlz Darvin 1876-cı ildə "Mənim yayımladığım bir həqiqətlə, müşahidəmlə və ya ümumi qənaətimə zidd olan bir fikirlə rastlaşanda dərhal və dərhal bu barədə yazmaq üçün bir memorandum yazmağı vərdiş etdiyini söylədi: çünki təcrübəmdən belə faktlar və düşüncələr əlverişli olmaqdan çox yaddaşdan qaçma ehtimalı çox idi ". Bunu özüm də görmüşəm. Ədəbiyyat icmallarını yazarkən, qəzetlərdə xüsusi qüsurları olmasa da, içgüdülərimə zidd olan sənədləri xatırlamağı tamamilə unutduğumu görəndə dəhşətə gəldim. İndi bunları sadalamağa çalışıram.

Hamımız öz işimizdəki qüsurları görməkdə çətinlik çəkirik - bu, insan idrakının normal bir hissəsidir. Ancaq bu kor ləkələri başa düşsək, onlardan qaça bilərik.

Çap