Истина это конец
Если вы не знали, как выглядит Абсолютная Истина и стеснялись спросить, вот её вид – с формальной стороны. Это байесовская формула P(A/B) = P(B/A)*P(A)/P(B), где P(A) = 1. А содержательно? Содержательно это может быть что угодно.
Если кого-то смущают такие штуки, обещаю – это первая и последняя формула здесь (по крайней мере, я так надеюсь). Но она и правду очень важна. Люди делятся на тех, кто её уже знает (и может пропустить несколько абзацев), и тех, кто не знает. Я сейчас кратко означу, что это такое, и если будет по-прежнему непонятно – не беда. Можно спокойно читать дальше с этим непониманием, можно специально почитать что-то про это, ключевые слова – теорема Байеса. Про это написано очень много людьми, которые куда больше моего в этом понимают и куда успешнее объясняют.
Итак,
Это формула – про что? Она лежит в основе современной теории вероятности и она про что угодно. Точнее всего сказать, что она про то, как должно работать (если по уму) наше познание. Логика науки действительно работает как-то так, когда мы мыслим хорошо и точно – мы приближаемся к этому методу.
В этой формуле:
P – вероятность.
A – наше убеждение в чем-либо.
B – свидетельство, как-то влияющее на убеждение (например, результаты опыта или буквально свидетельские показания).
P(A) – априорная вероятность факта или события. Можно также сказать, начальное убеждение.
P(A/B) – апостериорная вероятность. То, насколько событие вероятно с учетом свидетельства В.
P(B/A) – вероятность свидетельства в случае истинности А.
P(B) – вероятность получить данное свидетельство.
Как вообще происходит процесс познания? Как правило, о чем бы мы не задумались (о погоде, природе, повышении цен и своей зарплаты, наступлении коммунизма, бытии Божьем), у нас уже есть какое-то смутное представление, какая-то вероятность. Возможно, взятая с потолка. Многие скажут, что взять нечто с потолка – не лучшее начало. Конечно, не лучшее. Но лучше так, чем никак. Первый ход в этой партии может быть сколь угодно странен: «Бог существует с вероятностью 50%», «цена вырастет с вероятностью 80%», «Маша согласится с вероятностью 30%». Но если дальше верно учитывать новые свидетельства, и, главное, не бояться их получать, мы довольно быстро проясним ситуацию и с ценой, и с Машей, и даже с Богом. И главное, не так уж важно, с какой нулевой гипотезы мы начали – важно, честно ли пошли по пути, и все честные пути по мере прохождения будут сходиться к одной цифре.
Давайте поясним на самом простом примере, как это работает. Взять ли зонт, выходя из дома? У всех разное отношение к дождю, и к ношению зонта вхолостую. Допустим, пороговое значение, при котором мы возьмем зонт – 20% вероятность дождя, или менее 80% вероятности «без осадков», что можно записать как 0.8. Есть статистика по данному месяцу в данном месте – без осадков 60% всех дней, то есть 0.6. Это наша априорная гипотеза. И если у нас есть только она, без зонта сегодня не обойтись, как и всегда.
Но допустим, у нас есть дополнительное свидетельство – прогноз погоды. Предположим, что синоптики у нас так себе, и, давая прогноз на дискретное событие (вроде дождь/без осадков), они правы лишь в 70% случаев. Вы видели много их прогнозов и сами вывели эти 70%. Прогноз синоптиков «сегодня без осадков». Вопрос, брать ли зонт?
Иными словами, нам нужно вывести P(A/B), зная все остальное. Тогда в числителе у нас 0.7*0.6=0.42. Это вероятность всех ситуаций, при которых прогноз «без осадков» совпадает с их реальным отсутствием. Это число надо поделить на P(B). Но P(B) = P(B/A)*P(A) + P(B/not A)*P(not A). То есть сумму всех вероятностей, когда синоптики дают такой прогноз, включая те случаи, когда он ошибочный. В знаменателе будет 0.6*0.7 + 0.4*0.3 = 0.54. Дальше 0.42/0.54 = 0.777. Это меньше, чем пороговое значение 0.8, значит, зонт берем.
Вообще, вывод: в данном месяце не обращать внимание на прогнозы погоды, пока их точность не повысится, или пока не вырастет ваша толерантность к осадкам. Вы при любом прогнозе должны носить свой зонт, пока вам настолько неприятен дождь.
Это простой пример того, как наука считает довольно сложные вещи. Главная фишка в том, что одних результатов опыта – мало. Мы меняем наши убеждения на основании опыта, но нужно учитывать а). вес априорных убеждений, б). погрешность свидетельств. Тогда, если мы выбиваем из мира достаточно свидетельств, наша картина мира меняется куда надо независимо от начальной точки.
И что, мы предлагаем проделывать такие вычисления по любому мало-мальски значимому поводу? Скажем больше: они уже вершатся без нашего ведома. Наш мозг это байесианский компьютер на углеродной основе, примерно вот таким он и занят. Обычно – бессознательно. Выслушав прогнозы синоптиков о ясной погоде, он почему-то всё равно выбирает зонт…
Но я обещал показать, в чем заключается Абсолютная Истина и почему это очень-очень плохо. Как минимум, это просто скучно, как максимум – плохо совместимо с выживанием человечества. Напомним формулу P(A/B) = P(B/A)*P(A)/P(B), где P(A) = 1. Говоря простым языком, это априорная вероятность, взятая за 1, или, если кому-то так больше нравится, за 100%.
Легко увидеть, что это исключает дальнейшее познание. Если P(A) = 1, ни одно свидетельство ничего не изменит, мы получили окончательный ответ. Или хуже того – мы начали с окончательного ответа. Если P(A) =1, то P(not A) = 0, и P(B) = P(B/A)*P(A) + P(B/not A)*P(not A) = P(B/A)*P(A). Числитель всегда равен знаменателю, и независимо от любых свидетельств P(A/B) = 1.
Если с языка цифр перевести на русский, то…
Если мы в чем-то уверены на 100%, это означает, что нет такого опыта, который заставил бы нас изменить свое убеждение.
Апостериорная вероятность будет всегда равна априорной, если первая равна 1. При этом весь мир может говорить против нас, уже неважно. Самое сильное свидетельство уже ничего не изменит. Познавать нечего – формально считается, что мы дошли до конца, и это вправду конец, локальный когнитивный коллапс. Вы как бы подписали обязательство (и поклялись жизнью!) никогда не менять свое мнение по некоему вопросу – вам не страшно от подобной необратимости? Вот если бы наша начальная уверенность равнялась хотя бы 0.9999, с этим можно было бы что-то сделать. Если мы оставляет хотя бы 0.01% вероятности, что наши истины неверны, они могут измениться. Даже если мы оставляем вероятность один против триллиона – правда может просочиться в эту щель и всё исправить, если мы все-таки были неправы. Но P(A) = 1 это конец игры по определению.
Но это же и есть определение Абсолютной Истины! Если мы считаем наше убеждение лишь вероятным, пусть даже сильно вероятным, какая же это Истина с большой буквы, если её можно пересмотреть в процессе? Это всего лишь предпочтительная гипотеза, но когда люди жаждут истину, они, я подозреваю, хотят чего-то большего. На временную гипотезу они согласятся с чувством, что им недодали, что это еще не то. Но не тем – опасным, загоняющим в тупик не тем – была бы как раз истина, как её хотят. Сколько раз людям казалось, что их убеждения верны на 100%? Человечество развивалось лишь потому, что эти 100% уверенности все-таки никогда не были по-настоящему 100%, и это позволяло сделать шаг вперед.
На всякий случай: ни одно научное знание не подходит под это определение истины с P(A) и P(A/B) = 1.
Нам могут возразить – а как же математика? Мы же полностью и окончательно уверены, что дважды два четыре? Да, на это можно ставить с сильной уверенностью. Миллион к одному, триллион к одному, если вас не пугают большие числа – гугол к одному. Но все равно не бесконечность. Опуская в коробку с двумя яблоками еще два яблока, у нас сильная вероятность (хоть гугол к одному, если вы бесстрашный человек) обнаружить там четыре яблока, но все равно не бесконечная. Самое простое, почему там может оказаться три яблока или пять, или, возможно, черная кошка: мы живем в матрице, которая до поры притворялась нашими миром, и вот как только вы наконец решили умножить свои яблоки – проявила свое истинное лицо. Какое угодно лицо, заметим, с почти любыми законами. Два яблока плюс два яблока в этом мире могут равняться черной кошке, почему бы и нет? Так что ставить гугол к единице против матрицы я бы, например, поостерегся. Виртуальная реальность сильно вероятнее, даже если в нее не верить.
Чем же тогда занимается наука, если не открытием окончательных истин (как выяснили, подозрительных и опасных)?
Согласно Карлу Попперу, наука производит не истины, а теории, лучшие, чем альтернативные.
И фронтир науки это не набор истин, а набор лучших на сегодня теорий. Возможно, для кого-то звучит странно, но это мейнстрим уже более полувека.
Если что, сама теория Поппера – тоже не истина, а лучшая в моменте гипотеза на данную тему. Не больше, потому что никакого больше не бывает. Если кому-то кажется, что он поймал нечто «большее», то увы, в самом лучшем случае – у него это пройдет.
Давайте сразу будем скромнее. Во-первых, 100% уверенности не может быть. Ни в чем. Во-вторых, этого и не надо. Достаточно быть более правым, чем обычно здесь и сейчас. Не волнуйтесь, этого хватит. Вы не сдаете экзамен, где можно и нужно набрать сто баллов из ста, причем ответы заранее известны – хотя и не вам. Метафора экзамена вообще не очень уместна.
Исследуя, вы скорее соревнуетесь, чем сдаете экзамен.
Это разные занятия, к ним разный подход. При этом никто не знает, что такое мировой рекорд в познании. Давайте приведем самую скромную формулу самого большого успеха. Быть меньшим профаном в данном вопросе, чем кто-либо на свете. Можно сказать «большим спецом», но мне симпатичнее фраза с «меньшим профаном».
Итак, любая теория это набор вероятностных суждений (при этом можно как угодно заблуждаться насчет их вероятности, сейчас это не важно). Но в обыденном языке истина не тоже самое, что вероятностное суждение, она потому и истина, что окончательная. И тогда лучшее на земле знание не имеет отношения к такой истине. Тому, кто обладает окончательной истиной – можно посочувствовать. Но это рискованно. Он вам, скорее всего, не посочувствует.
P(A) = 1 в формуле Байеса это диагноз фанатика.
Его радует то, что пугает нормального человека. Представьте, что некто поклялся жизнью не менять свое мнение, после чего его жизнь заиграла новыми красками, приобрела смысл, и т.д. Не менять свое мнение синоним «исключить развитие». И пусть буквально такой клятвы не произносят, многие ведут себя так, как будто её давали – в обмен на то, что они называют смыслом.
При этом научные и другие фрики часто требуют высокого, действуя низко. Один из подлых приемов: сначала обвинить оппонента в не абсолютности его знаний («вы же не владеете окончательной истиной?»). И пока он будет приходить в себя от странной претензии, тащить что угодно в обход лучшей из существующих версий… Всё равно что презрительно заметить, что 5-тысячная купюра – это не состояние, а так себе, мелочь, и на основании этого пытаться подменить её 50 рублями. Кажется, это предельная наглость или запредельная глупость, но со мной так спорили много раз.
Заметим, идеи Поппера называются «критический рационализм». Это не имеет никакого отношения к постмодернизму, релятивизму и т.п. Теория о том, что из двух теорий на одну тему одна почти всегда лучше другой, и теория о том, что все теории равнозначны – это две сильно разные теории. И одна из них явно лучше другой.
Самое простое опровержение релятивиста – предложить ему пожить в мире, где все теории действительно равнозначны. Сказать, что в этом мире у него будут проблемы – значит переоценить такой мир. Пожалуй, он невозможен даже в качестве эксперимента или изощренного наказания. Представьте мир, где что угодно могут начать делать как угодно. Например, как угодно строить дома, делать технику, судить людей. Это история даже не сможет толком начаться, чтобы бесславно завершиться. Возможны лишь элементы такого мира в нашем. И как сказано, это было бы наказанием: проживание в месте, где запрещена эффективность в той или иной области.
Кое-что известно заранее
Я хотел много написать про теорему Байеса, а потом расхотел. У математика это получится лучше, и уже есть много хороших текстов. Давайте налегке, без формул. На всякий случай – считайте этот абзац указателем в сторону тех самых текстов. Формула, о которой речь, действительно одна из главных для человечества, и если её нет в школе, это говорит лишь о школе.
Но всё-таки скажем пару слов. Самые простые ошибки, связанные с применением теоремы (точнее, не применением) в практической жизни.
Как правило, люди недооценивают априорные вероятности. Это как бы подводная часть айсберга реальности, она не лезет в глаза. Но если понять, что она есть, мир предстанет по-другому.
Собственно, что мы делаем, познавая что-либо? У нас всегда есть две вещи. Во-первых, некие априорные представления о предмете еще до знакомства с ним. В каком-то виде они есть всегда, мы знаем что-то даже про то, о чем ничего не знаем. О каком бы новом знании не зашла речь, одни варианты, как правило, удивят нас больше других. Но что значат – удивят? Значит, у нас уже были какие-то смутные ожидания на их счет.
Дальше мы получаем новую информацию, это свидетельства, призванные как-то поменять картину миру. Она поменяется в любом случае, даже если не поменяется, такой вот парадокс. Допустим, мы получили сугубо положительные свидетельства, подтверждающие наши представления. Сами представление не поменялись, но поменялось то, насколько мы в них уверены. Любое наше утверждение, если мы не фанатики, всего лишь вероятностно. Например, мы были уверены на 90%, что политик Икс вор и жулик, пришли новые свидетельства, они за нас – и теперь мы уверены в этом на 99%. Можно сказать, что в картине мира ничего не поменялось, но это не так. Сомнения стало меньше на порядок, это довольно серьезное изменение.
Но допустим, пришли какие-то отрицательные свидетельства. Не то, чтобы Икс полностью оправдан в наших глазах, но после них он вор и жулик только с вероятностью 50%. И во втором случае, в отличие от первого, мы будем удивлены. В первом случае мы дожимали нашу уверенность, картина мира смещалась туда, куда и так была смещена – это процесс, который люди подсознательно ждут и хотят. Во втором случае мы можем порадоваться, ибо честности в мире стало больше (хотя бы вероятностно), но мы признаем свою ошибку, смещая вероятность против априорной гипотезы. И вот что бы мы не узнали, это удивит нас по-разному. Потому что будет разное отношение к версии номер ноль.
А какая-то версия номер ноль мерцает всегда. Допустим, вопрос: чего больше – песчинок на Земле или звезд на небе? Или лучше уточнить «звезд во Вселенной» (чтобы не ссылались на плохие телескопы). Это не риторический вопрос, он имеет ответ, хотя без 100% уверенности. Это две цифры, о которых наука имеет примерное представление, их можно сравнить, хотя можно при этом спорить. Цифры вряд ли ведомы обычному человеку, если его попросить их прикинуть – он легко может ошибиться в миллиард раз, может и больше. Это нормально, мы не физики, и даже физики не обязаны это знать. Но какой-то из ответов всё равно будет казаться вероятнее, то есть какое-то знание у нас как бы есть даже несмотря на полное, казалось бы, незнание. Допустим, человеку предлагают приз, если он правильно ответит на этот вопрос, или приз, если монетка упадет орлом. Любой, кто откажется от орлянки в пользу любой идеи, этим уже признает наличие какой-то априорной гипотезы. И неважно, откуда она взялась. «Я так чувствую».
Часто мы знаем, какие у нас априорные гипотезы, откуда и почему. Отлично знаем, но… отлично и забываем. Пример: ответьте на вопрос, кем скорее всего является молодой человек – солдатом или аспирантом кафедры филологии? Информация про него: вежливый, немного испорчено зрение, ай-кью выше 100. Почти любая неподготовленная аудитория ставит на филолога, и зря делает. Солдат в любой стране сильно больше, чем аспирантов-филологов. Вот если бы их было поровну – тогда да, все улики за аспиранта. Но солдат настолько больше, что свидетельства тянут за филологию, но все равно не дотягивает. Неглупых солдат с плохим зрением всё равно будет больше, чем конкретно аспирантов на конкретных кафедрах.
На чем построено ошибка? На том, что аналоговое мышление покупается на картинку. Оно сразу рисует этого человека, и дальше думает лишь о том, куда скорее положить этот рисунок. И явно полка ближе к науке, чем к армии. Цифровое мышление считает. Оно начинает с того, что фиксирует априорные вероятности. Допустим, мы ничего не знаем о человеке, давайте просто прикинем численность групп. Хотя бы примерно. На миллион человек приходится несколько тысяч солдат. Прикинуть по аспирантам сложнее. Но можно от балды, ошибиться в три раза не страшно. Сколько кафедр филологии в миллионном городе? Сколько аспирантов на каждой? Если два числа перемножить, больше, чем «несколько десятков» мы не получим, и то, если город культурный. Различие априорных вероятностей на два порядка. Если мы ничего не знаем о человеке, ставка 100 к 1, что это солдат, а может, еще выше. Свидетельства понижают вероятность, но не меняют ответ, они даже не прогибают шансы до 1 к 1. Сильным свидетельством было бы «в настоящий момент он пишет диссертацию по Набокову», оно бы разбило априорные шансы – в армии не пишут таких диссертаций.
Зачем нам видеть такие вещи? Вот классический пример почти о том же, когда учет априорных вероятностей мог бы сберечь спокойствие, деньги и даже жизнь. Его часто приводят, так что просим прощения, если вы уже знаете отгадку на эту загадку.
Представьте, что есть опасная, потенциально смертельная болезнь. Встречается у 0.5% населения. Явных симптомов нет, но человек решает провериться на всякий случай. Есть метод диагностики с точностью 90%. То есть он назовет больного здоровым и наоборот в 90% случаев. Тест пройден. Врач говорит «анализы показали, вы больны». Но немного поправляется: «вероятно, вы больны». Есть метод лечения – болезненный, дорогой, с кучей побочных эффектов. Но речь о жизни и смерти, и вроде бы надо влезать в долги, мучиться и становиться инвалидом уже от лечения. Скорее всего, нормальный человек так и поступит – аналоговое мышление велит так. Раз доктор сказал, значит так и есть. Максимум, что оно готово уступить, вспомнить слово «вероятность». Какая там точность, 90%? Ну мы же не будем надеяться на жалкие 10%, что всё обойдется…
Теперь вопрос: какова вероятность, что человек, получивший по итогам этого теста заключение, что он болен, действительно болен? Если вам не противна эта задачка, подумайте сначала сами. Можно ответить два раза. Первый «на интуиции», второй просто посчитать.
Давайте на конкретных цифрах. Допустим, множество 10000 человек. Если больных всего 0.5%, то это лишь 50 человек. Предположим, через этот тест прошли все. 50 больных поделились на 45 настоящих больных и 5 ложно здоровых. 9950 здоровых тоже поделились на 8955 здоровых, признанных здоровыми, и 995 ложно больных. Нашего пациента признали больным, но это значит, что он попал в одну из двух групп – либо настоящих больных, либо ложно больных. В сумме тех и других 995 + 45 = 1040. Делим подлинно больных на всех, кого признали больными. Получаем всего примерно 4.3%, что человек действительно болен.
Пожалуй, здоровому с вероятностью более чем в 95% не стоит продавать квартиру и влазить в долги, чтобы получить сомнительное лечение? Можно ничего не делать совсем. Если очень хочется, можно пройти другое обследование. Но чего делать точно не стоит – так это паниковать. И кстати, при таких вводных условиях не стоило проходить эту диагностику: забота о своем здоровье оборачивается чем-то обратным, вы не находите?
Это немного идеальный и закругленный пример, но похожее происходит на планете каждый день. Зря тратятся миллионы долларов, зря идут под риск тысячи жизней – только потому, что мы не считаем нужным считать. Или не умеем.
Имея дело с априорной гипотезой и потоком свидетельств, стоит запомнить две вещи. Во-первых, помните, что было в априорной гипотезе. Если она достаточна тяжела (как с процентом филологов или больных в общей массе), не игнорируйте эту тяжесть. Уничтожить тяжелую вероятность в 99.99% сложнее, чем более легкую вероятность в 70%. Раньше я приводил пример про друга, который встретил в городском парке белочку и колдуна. В обоих случаях свидетельство одно и то же – слова друга. Но априорная вероятность у белочек и колдунов разная, в первом случае – свидетельства хватит, во втором – нет.
Во-вторых, не игнорируйте поток свидетельств. Всё, что вы узнаете об этом мире, влияет на то, что вы уже знали. Новая информация всегда заставляет корректировать текущее представление. Даже если не меняется картинка в целом, белое остается белым, а черное черным, меняется вероятность элементов. Картина мира может быть легкой или тяжелой на подъем, но она не застывшая – никогда, если человек умственно полноценен (обычно с этим проблем нет) и не фанатик, хотя бы отчасти, хотя бы кое-где (а вот здесь беда у многих).
Конечно, люди медленнее и слабее реагируют на новые свидетельства, чем они того стоят. Мы всегда уже что-то думаем о себе и о мире. Если мы выбирали картинку, исходя из своих вкусов, то новая картинка почти наверняка должна понравиться меньше. Психика полагает, что должна менять няку на бяку, и тормозит, саботирует. Сейчас она не за вас. Не верьте ей и меняйте.