Тази нощ, в пристъп на безсъние, попаднах на обява за безплатен онлайн курс по математика за журналисти, публикувана в сайта на Асоциацията на европейските журналисти - България. Идеята на курса е да се помогне на журналистите, които боравят със статистически данни - да ги интерпретират правилно, да разпознават подвеждащите изследвания, и т.н. Курсът е към университета в Остин, Тексас. Ето кратко видео представяне на идеята му:
Работила съм доста години като социолог, участвала съм и в създаването и анализирането на количествени изследвания. Имам известно понятие от SPSS - една от най-популярните програми за обработка на статистическа социална информация. Затова смятам, че имам сериозно предимство, когато като журналист или блогър интерпретирам количествени изследвания. В същото време си давам сметка, че в познанието ми има сериозни дупки. Завършила съм философия, не социология, и не съм учила статистика. Когато става дума за статистически коефициенти и други подобни тънкости, гледам тъпо. Тъй че се надявам, че от курса ще има какво да науча.
Ще се радвам, ако повече български журналисти и блогъри запишат този курс. Защото има основни грешки, които медиите допускат (в блоговете това се случва доста по-рядко, в интерес на истината), когато интерпретират данни от количествени изследвания. Ще скицирам само някои от тях:
Много често журналисти не държат сметка доколко представителни са дадени данни. Примерно - прави се изследване на принципа на отзовалите се, а резултатите се генерализират. Например някоя медия (или блог) провежда онлайн анкета сред собствената си аудитория, а представя резултатите като това, което "българите" мислят по определена тема. Или се превежда поредната малоумна статия за "британските учени", които направили експеримент сред неколцина студенти и стигнали до бомбастичния извод какви са жените и какви - мъжете. Често пъти тези грешки не са случайни - те по същество са манипулативни, имат за цел да засилят въздействието на получените резултати. А и, ако имате известно понятие от хората, които анкетирате (примерно аудиторията на сайта си), можете да предположите и какви резултати ще получите. Така се манипулират и уж представителни социологически изследвания - ако искаме да услужим на БСП, слагаме в извадката малко повече пенсионери, и т.н. Затова е добре социологическите агенции да публикуват информация как точно са направили изследването - с каква извадка, какви методи, но това невинаги се прави.
Често се случва и журналистите да се затрудняват в интерпретирането на степента на общност на отговорите, а понякога - и съзнателно да манипулират в тази посока. Примерно (тук си измислям данните) - прави се представително изследване по всички правила. В него се задава въпросът "Имате ли смартфон или друго "умно" устройство?" Ако респондентът е отговорил с "да", следва въпросът: "С каква операционна система е вашето устройство?" После виждаме из медиите заглавие, че 80% от българите ползват операционната система Андроид. Ама то не било от българите, а от пълнолетните българи, които са отговорили, че имат мобилен телефон. А спрямо всички пълнолетни българи процентът може да е, примерно, 40%. Ако вземем и децата, които не са участвали в изследването, вече ще получим други данни. Но за да ги питаме, ни трябва разрешение от родителите или настойниците им.
А когато трябва да се интерпретират двумерни разпределения, настава ужас. То и на студентите по социология им е трудно, понякога и професионални социолози се объркват, особено ако нямат много вземане-даване с количествени изследвания, та на журналистите им е простено. Но все пак човек трябва да разбира какво пише. И да прави разлика между, примерно "относителния дял на пенсионерите, които живеят на село" и "относителния дял на живеещите на село, които са пенсионери". Замислихте ли се :-)? Е, на журналисти рядко им се налага да се ровят в двумерни таблици, но понякога може им потрябва. Случва се обаче човек да се "подхлъзне" и с вече интерпретирана информация, ако не е трениран да вижда разликата - че в единия случай преценяваме според съвкупността "хората, които живеят на село", а в другия - според съвкупността "пенсионери".
Друга типична грешка (и манипулация) е да се прави връзка между данни и/или тенденции, между които няма доказана връзка. Примерно, ако делът на самоубийствата е по-висок сред ЛГБТ хората, може да се направи (и се прави, виждала съм) извода, че тези хора имат по-силна склонност към самоубийство от хетеросексуалните. Един вид, самоубиват се, защото "не са нормални". Самоубийствата обаче може да са не защото ЛГБТ хората "са ненормални", а поради хомофобията, тормозът, социалната изолация, дискриминацията които са им се случили. Или любимият вече на мнозина пример с аутизма. Ако децата се разболяват от аутизъм след като им е направена ваксинация, това не означава, че ваксината е причина за болестта. Както казва британският философ Дейвид Хюм, "след това" не значи "поради това".
Това са само част от типичните грешки, които се правят при интерпретация на количествени данни. Надявам се, че по време на курса ще науча и за такива, които не съм знаела до този момент, както и че ще се поограмотя малко повече в статистиката.
И ще се радвам, ако повече български журналисти, а защо не и блогъри, се включат в курса. Има нужда от грамотна журналистика.
Работила съм доста години като социолог, участвала съм и в създаването и анализирането на количествени изследвания. Имам известно понятие от SPSS - една от най-популярните програми за обработка на статистическа социална информация. Затова смятам, че имам сериозно предимство, когато като журналист или блогър интерпретирам количествени изследвания. В същото време си давам сметка, че в познанието ми има сериозни дупки. Завършила съм философия, не социология, и не съм учила статистика. Когато става дума за статистически коефициенти и други подобни тънкости, гледам тъпо. Тъй че се надявам, че от курса ще има какво да науча.
Ще се радвам, ако повече български журналисти и блогъри запишат този курс. Защото има основни грешки, които медиите допускат (в блоговете това се случва доста по-рядко, в интерес на истината), когато интерпретират данни от количествени изследвания. Ще скицирам само някои от тях:
Много често журналисти не държат сметка доколко представителни са дадени данни. Примерно - прави се изследване на принципа на отзовалите се, а резултатите се генерализират. Например някоя медия (или блог) провежда онлайн анкета сред собствената си аудитория, а представя резултатите като това, което "българите" мислят по определена тема. Или се превежда поредната малоумна статия за "британските учени", които направили експеримент сред неколцина студенти и стигнали до бомбастичния извод какви са жените и какви - мъжете. Често пъти тези грешки не са случайни - те по същество са манипулативни, имат за цел да засилят въздействието на получените резултати. А и, ако имате известно понятие от хората, които анкетирате (примерно аудиторията на сайта си), можете да предположите и какви резултати ще получите. Така се манипулират и уж представителни социологически изследвания - ако искаме да услужим на БСП, слагаме в извадката малко повече пенсионери, и т.н. Затова е добре социологическите агенции да публикуват информация как точно са направили изследването - с каква извадка, какви методи, но това невинаги се прави.
Често се случва и журналистите да се затрудняват в интерпретирането на степента на общност на отговорите, а понякога - и съзнателно да манипулират в тази посока. Примерно (тук си измислям данните) - прави се представително изследване по всички правила. В него се задава въпросът "Имате ли смартфон или друго "умно" устройство?" Ако респондентът е отговорил с "да", следва въпросът: "С каква операционна система е вашето устройство?" После виждаме из медиите заглавие, че 80% от българите ползват операционната система Андроид. Ама то не било от българите, а от пълнолетните българи, които са отговорили, че имат мобилен телефон. А спрямо всички пълнолетни българи процентът може да е, примерно, 40%. Ако вземем и децата, които не са участвали в изследването, вече ще получим други данни. Но за да ги питаме, ни трябва разрешение от родителите или настойниците им.
А когато трябва да се интерпретират двумерни разпределения, настава ужас. То и на студентите по социология им е трудно, понякога и професионални социолози се объркват, особено ако нямат много вземане-даване с количествени изследвания, та на журналистите им е простено. Но все пак човек трябва да разбира какво пише. И да прави разлика между, примерно "относителния дял на пенсионерите, които живеят на село" и "относителния дял на живеещите на село, които са пенсионери". Замислихте ли се :-)? Е, на журналисти рядко им се налага да се ровят в двумерни таблици, но понякога може им потрябва. Случва се обаче човек да се "подхлъзне" и с вече интерпретирана информация, ако не е трениран да вижда разликата - че в единия случай преценяваме според съвкупността "хората, които живеят на село", а в другия - според съвкупността "пенсионери".
Друга типична грешка (и манипулация) е да се прави връзка между данни и/или тенденции, между които няма доказана връзка. Примерно, ако делът на самоубийствата е по-висок сред ЛГБТ хората, може да се направи (и се прави, виждала съм) извода, че тези хора имат по-силна склонност към самоубийство от хетеросексуалните. Един вид, самоубиват се, защото "не са нормални". Самоубийствата обаче може да са не защото ЛГБТ хората "са ненормални", а поради хомофобията, тормозът, социалната изолация, дискриминацията които са им се случили. Или любимият вече на мнозина пример с аутизма. Ако децата се разболяват от аутизъм след като им е направена ваксинация, това не означава, че ваксината е причина за болестта. Както казва британският философ Дейвид Хюм, "след това" не значи "поради това".
Това са само част от типичните грешки, които се правят при интерпретация на количествени данни. Надявам се, че по време на курса ще науча и за такива, които не съм знаела до този момент, както и че ще се поограмотя малко повече в статистиката.
И ще се радвам, ако повече български журналисти, а защо не и блогъри, се включат в курса. Има нужда от грамотна журналистика.