Эффективность малой группы по сравнению с большой группой
Есть ещё один «навскидочный» философский вывод о демократии: «демократия - это хорошо, но, конечно же, голосовать по неким вопросам должны только специалисты в этих вопросах».
Однако и он, несмотря на кажущуюся интуитивность, оказывается не верным в общем случае: ведь, чем меньше человек в коллективе, тем больше должна быть средняя вероятность угадывания каждого его участника для достижения той же эффективности угадывания всем коллективом.
Выбирая из коллектива малую группу специалистов, которые потом будут принимать решение голосованием, мы радикально снижаем численность коллектива и тем самым радикально повышаем требования к средней вероятности угадывания среди специалистов.
Да, возможно подобрать такие условия, при которых выделение в число имеющих право голосовать малой группы «специалистов» приведёт к повышению вероятности угадывания правильного решения. Однако далеко не во всех случаях это вообще возможно на практике: требования к вероятности угадывания среди этой малой группы, чтобы она могла сравниться с большой, могут оказаться вообще недостижимыми в реальном мире.
Предположим, что мы решили заменить коллектив из 100 000 человек коллективом из 30 специалистов. В большом коллективе из неспециалистов вероятность угадывания равна 0,51. Какова должна быть вероятность угадывания у специалистов, чтобы они оказались не хуже этого коллектива?
Она должна быть равна 0,93. Каждый из неспециалистов может угадывать чуть лучше монетки, но каждому специалисту уже придётся угадывать в 93% случаев.
А что если коллектив неспециалистов угадывает с вероятностью 0,52? Тут каждому специалисту уже надо угадывать с вероятностью 0,9989.
При вероятности же угадывания неспециалистами равной 0,55 требуемая для специалистов вероятность столь мало должна отличаться от единицы, что на практике это означает «они должны угадывать вообще всегда».
С другой стороны, если есть возможность выбрать 1000 особо талантливых из 100 000 человек, которые в среднем угадывают с вероятностью 0,51, то это может быть вполне оправданным, поскольку «специалистам», чтобы превзойти этот коллектив, понадобится средняя вероятность угадывания 0,6. Это вполне достижимо.
Однако дело осложняется тем, что и тут требуемая вероятность угадывания большого коллектива слишком быстро становится неотличимой от единицы. Например, если вероятность угадывания в вышеупомянутом коллективе не 0,51, а 0,6, то коллектив из 1000 «специалистов» уже будет вынужден иметь для каждого из них среднюю вероятность угадывания 0,996.
В целом зависимость вероятности принять правильное решение для коллектива зависит от вероятности угадывания каждого и количества людей в коллективе выглядит следующим образом (для наглядности синим отчёркнута область, выше которой вероятность коллективно угадать правильное решение больше 0,99).
Когда демократия заведомо неэффективна
Из ранее приведённого трёхмерного графика видно, что определённо существует область, при которой вероятность принятия правильного решения меньше любого наперёд заданного числа из диапазона (½, 1). То есть мы всегда можем подобрать коллектив с такими параметрами, что он окажется хуже данного нам диктатора. Правда, для этого в большинстве случаев придётся сделать этот коллектив очень малочисленным и с очень слабо превышающей ½-ю средней вероятностью угадывания правильного решения.
Однако возникает вопрос: существуют ли такие параметры, при которых имело бы смысл взять диктатора наугад из самого коллектива?
Это равнозначно вопросу, есть ли такая область, где
и одновременно с тем
Для ответа на этот вопрос построим график функции
Там, где эта функция меньше нуля, выбранный из коллектива диктатор выгоднее, чем принятие решение путём голосования (синяя плоскость здесь соответствует нулевому уровню).
На данном графике «гребёнка» возникает из-за особенностей правил игры: при равном количестве голосов выбирается неправильный вариант, что приводит к тому, что при чётном количестве участников вероятность принятия правильного решения несколько ниже, чем при соседних нечётных.
Видно, что интересующая нас разность оказывается ниже нуля только при чётных количествах участников. Причём даже это происходит исключительно в области малого количества участников и очень близкой к ½ вероятности угадывания каждого из них.
Если же исключить из рассмотрения проблемные чётные численности коллектива, то функция окажется везде положительной
Иными словами, только непонятки с тем, что делать, когда количество голосов «за» и «против» оказалось равным в малочисленном коллективе с чётным количеством участников, в котором, в среднем, все угадывают с вероятностью, близкой к исходу подбрасывания монетки, могли бы позволить диктатору, выбранному наугад из коллектива, оказаться более эффективным, чем голосование.
Тут опять же нужны пояснения.
Конечно, нам может повезти, и мы наугад выберем именно того, особо талантливого, который угадывает сильно лучше других. Но ровно с тем же успехом нам может, наоборот, не повезти, и мы выберем того, кто угадывает хуже большинства остальных.
Поэтому вышеприведённое утверждение следует понимать следующим образом: если мы будем много раз наугад выбирать диктаторов из разных коллективов, то в среднем они будут принимать решения заметно хуже, чем этот коллектив голосованием. И только в том случае, когда в коллективе малое чётное количество человек, средняя вероятность угадать у каждого близка к ½ и в правилах прописан проигрыш правильного варианта при равенстве голосов, то выбираемые наугад диктаторы будут в среднем давать результат в среднем лучший, чем у этого коллектива.
При этом простейшее решение - например, каждый раз случайным образом исключать одного участника из голосования, чтобы не допустить равенства голосов, или в случае равенства голосов выбирать вариант броском монетки - уже приведёт к тому, что даже в этом случае диктатор оказывается не выгоден никогда.
График преимущества демократии
График функции, рассмотренный в предыдущем разделе, …
…можно охарактеризовать, как «график величины преимущества демократии» - ведь он как раз отражает величину разрыва между вероятностью угадывания коллективом и средней вероятностью угадывания его отдельного участника.
По графику видно, что, независимо от численности коллектива, наиболее высокое преимущество достигается как раз в «области слабой уверенности» - там, где вероятность правильного угадывания примерно равна 0,6. И оно, разумеется, тем выше, чем больше численность коллектива.
Хотя и тут тоже могло бы интуитивно показаться, что это, наоборот, в тех случаях, когда все почти точно знают правильный ответ (то есть средняя вероятность угадывания по коллективу равна, например, 0,95), демократия должна была бы демонстрировать особенно сильное преимущество.
Основная проблема демократии
До сего момента рассматривались случаи, когда вероятность угадывания каждого участника коллектива больше, чем ½. И во всей этой области демократия имела преимущество над диктатурой.
Однако то, что обуславливает преимущество, обуславливает же и недостаток.
Средняя вероятность угадывания правильного варианта у голосующих может оказаться меньше ½. Такое возможно, например, если в коллективе господствует некоторое заблуждение о положении вещей.
И в этом случае вероятность выбора правильного ответа голосованием столь же быстро устремится к нулю, как до того стремилась к единице.
Вместе с тем окажется, что диктатор - даже угадывающий путём броска монетки - гораздо более эффективен, нежели коллектив: ведь он будет угадывать в среднем один раз из двух, коллектив же - почти никогда.
Одновременно с тем однозначно выгодным (с поправкой на заморочки с равным количеством голосов) оказывается назначение наугад выбранного участника в качестве диктатора: несмотря на то, что такой человек будет угадывать даже хуже, чем монетка, он всё-таки будет угадывать лучше, чем коллектив.
Ровно поэтому, в частности, на практике может получаться, что малый коллектив специалистов, принимая решения голосованием, оказывается гораздо лучше, чем большой коллектив, в основном состоящий из неспециалистов: если в обществе есть заблуждение по определённому вопросу, то даже если оно в той же пропорции представлено среди малого коллектива, всё равно он будет принимать правильные решения существенно чаще (хотя и реже, чем монетка).
Если же учесть, что среди коллектива специалистов заблуждение может быть представлено в меньшей мере, то его выигрыш будет радикальным: почти единичная вероятность принятия правильного решения против почти нулевой у большого коллектива.
Наконец, при низком уровне знаний в обществе диктатор-специалист может оказаться одним из тех немногих, который вообще сможет озвучить правильный вариант - ведь чтобы его стало возможным выбрать, он должен быть хотя бы озвучен.
Распределение вероятности правильного выбора
Предыдущий раздел, казалось бы, должен однозначно свидетельствовать против демократии, однако с этим свидетельством возникает ряд нюансов.
Заблуждение может присутствовать, но далеко не всегда присутствует: даже в условиях не очень хороших знаний о некой сфере и не очень развитом критическом мышлении люди довольно часто при выборе из двух вариантов принимают правильное решение с вероятностью большей, чем ½, а не меньшей. Поскольку, конечно, есть вещи не очевидные, есть вещи, требующие специальных знаний, есть вещи, обманчивые, но не все вещи такие. И не для всех вещей малое количество опыта по связанным с ними темам делает вероятность неправильного варианта из двух предложенных именно, что выше, чем правильного.
Ведь при полном незнании правильного ответа на вопрос, в отличие от заблуждения, вероятность выбора правильного ответа - в точности ½, а не «меньше ½». В результате, для того, чтобы средняя вероятность правильного выбора у каждого участника была ниже одной второй, большинству из них мало не знать правильного ответа - надо «знать» неправильный. То есть полагать неверный ответ верным с достаточной степенью уверенности. Иными словами, находиться под властью заблуждения.
Хотя коллектив, в большинстве своём находящийся под властью заблуждения, примет неправильное решение по связанному с этим заблуждением вопросу с большей вероятностью, чем диктатор, однако мы при оценке эффективности демократии или диктатуры должны смотреть на ситуацию в среднем по всем вопросам.
Маловероятно, что вообще все правильные ответы на все вопросы входят в противоречия с какими-то предрассудками большинства участников. Маловероятно, что даже правильный ответ на каждый второй вопрос им противоречит. Напротив, сам факт того, что человечество не только не вымерло, но и даже продолжает развиваться, должен говорить нам о том, что в среднем, видимо, люди при выборе из двух вариантов чаще принимают правильные решения чаще, чем неправильные.
По этой причине, если мы рассматриваем вопрос, про которому нам заранее неизвестно, есть ли по нему массовое заблуждение, то мы не можем однозначно сказать, что вероятность точно будет ниже ½. Напротив, имеет смысл предположить, что она скорее всего больше ½ - ведь меньше, чем по половине всех вопросов существуют доминирующие заблуждения. Скорее всего таких даже 10% не наберётся.
Аналогично, могут быть целые области, где предрассудки данного коллектива обуславливают бо́льшую вероятность неправильного ответа, нежели правильного, но в этих областях вряд ли содержится больше половины решаемых этим коллективом вопросов.
То есть, хотя в некоторых областях средняя вероятность выбора правильного варианта в среднем меньше, чем ½, средняя для всего множества вопросов вероятность правильного выбора всё-таки больше, чем ½.
Вероятность выбора правильного варианта на всём множестве
Попробуем оценить вероятность правильного выбора для тех условий, когда вероятности принятия правильного решения для разных вопросов разные.
Иными словами, есть, например, некоторая часть вопросов, для которых каждый участник в среднем выберет правильный вариант с вероятностью 0,6, есть часть вопросов, для которых вероятность правильно выбрать 0,4, есть - 0,9 и так далее.
Однако количество вопросов с вероятностью правильного выбора 0,6 скорее всего не равно количеству вопросов с вероятностью правильного выбора 0,4.
Количественное соотношение между группами вопросов может быть описано функцией плотности вероятности, которая по смыслу аналогична тому, что обычно отображается при помощи гистограмм: сколько элементов попало в тот или иной диапазон. За тем отличием, что в каждом «столбике» функции плотности вероятности будет содержаться не количество вопросов с такой-то вероятностью правильного выбора, а их доля от общего количества. И «столбики», вместе с тем, будут иметь стремящуюся к нулю толщину.
Эта функция, одновременно с тем, определяет с какой вероятностью наугад выбранный вопрос из полного их множества попадёт в ту или иную группу, то есть будет иметь некоторую конкретную вероятность правильного ответа.
Обратите внимание, что сейчас в рассуждениях уже фигурируют две вероятности, а само событие «сделан правильный выбор», стало составным.
То есть сначала наугад выбирается вопрос, для которого надо выбрать ответ, а потом уже для этого вопроса с некоторой вероятностью выбирается правильный ответ. При этом функцией плотности вероятности задана вероятность того, что будет выбран вопрос с определённой вероятностью правильного ответа.
Вероятность правильного ответа при каждом принятии решения, таким образом, равна
Однако сейчас надо найти не вероятность успеха в одном конкретном решении вопроса, а вероятность успеха на всём множестве вопросов.
Для нахождения этой вероятности нам надо просуммировать все возможные на данном множестве произведения, аналогичные вышеописанному.
Поясню это более понятным примером.
Вы сдаёте экзамен. На экзамене всего 10 билетов, про которые вы знаете, что из них 2 сложных и 8 простых. На сложные вы правильно ответите с вероятностью 1/8, а на простые - с вероятностью 3/4.
Какова вероятность того, что вам достанется простой билет и вы на него правильно ответите?
Какова вероятность того, что вам достанется сложный билет и вы на него правильно ответите?
Но какова вероятность правильного ответа в целом? Она складывается из вероятности вытянуть простой билет и правильно ответить на него плюс вероятность вытянуть сложный билет и правильно ответить на него.
Аналогичная величина - вероятность правильно ответить на всём множестве - сейчас и будет искаться.
Распределение вопросов по вероятностям правильного ответа на них будем считать гауссовым - то есть нормальным распределением.
Формула плотности вероятности нормального распределения определена от минус до плюс бесконечности.
где μ - среднее распределения, а σ - его среднеквадратическое отклонение (определяющее ширину кривой на половине её высоты).
Поскольку вероятность наступления хоть какого-то события из полного их множества равна единице, для этой функции верно
Однако в рассматриваемом случае нормальное распределение вводится для вероятностей правильного ответа, которые не могут быть меньше нуля или больше одного, поэтому именно на этом отрезке и расположены абсолютно все вопросы. В результате нужно ввести нормировочный коэффициент для функции плотности вероятности. Он будет равен
В общем случае формула для этого коэффициента довольно громоздка.
где
поэтому она будет фигурировать просто под своим кратким именованием.
Нормированная функция плотности вероятности, таким образом, будет равна
Чтобы найти вероятность правильного решения на всём множестве вопросов, надо умножить вероятность принятия правильного решения для некоторого вопроса на вероятность возникновения этого вопроса (которая как раз и задана функцией плотности вероятности), а потом проинтегрировать результат от нуля до единицы. Это - аналог того, что делалось в примере с экзаменом, чтобы найти вероятность его успешной сдачи.
В случае с диктатором всё просто, вероятность принятия решения для некоторого вопроса совпадает с его координатой Икс в распределении вероятности возникновения вопроса.
Если интересно, то вот как выглядит полная формула со взятым интегралом в аналитическом виде.
Однако более полезно взглянуть на график, отражающий зависимость вероятности правильного ответа на всём множестве вопросов от средней вероятности правильного ответа для этого множества.
Для наглядности на нём также размещён график вероятности того, что диктатор ответит на конкретный вопрос, имеющий соответствующую координате по оси Икс вероятность правильного ответа (это - просто прямая с наклоном 45°).
Для демократического голосования вероятность правильного решения дана ранее выведенной функцией
Разве что на место p1 тут надо подставить x. Однако полная формула окажется совершенно нечитаемой, да и аналитически взять интеграл не получится, поэтому остаётся довольствоваться результатами численного интегрирования.
Если есть сомнения в верности всех этих построений, то отдельно подчеркну: эта формула тоже была проверена экспериментально.
Вот как это выглядит на графиках для некоторых количеств участников (тут, опять же, для сравнения приведены графики вероятности правильного ответа коллективом на конкретный вопрос с соответствующей координате по оси Икс вероятностью).
Видно, что вероятность правильного выбора на всём множестве вопросов не так быстро стремится к единице при повышении средней по распределению вероятности правильного выбора, как стремилась вероятность правильного выбора по конкретному вопросу при повышении вероятности сделать правильный выбор по нему.
Однако всё равно при достаточно большом количестве человек вероятность верного выбора на всём множестве весьма близка к единице уже при довольно небольших отклонениях среднего на всём множестве вопросов от ½.
Так при среднем по распределению вероятности правильного выбора на всём множестве вопросов для 1000 человек, равном 0,74, вероятность правильного выбора на всём множестве будет равна 0,99, а при среднем 0,63 - вероятность правильного выбора на всём множестве будет равна 0,9.
Это не настолько лучше, чем у диктатора, как было при конкретных вопросах, но всё равно заметно лучше.
Кстати, обратите внимание, что на полном множестве вопросов, даже если средняя вероятность сделать правильный выбор равна единице, вероятность того, что диктатор сделает правильный выбор всё равно меньше единицы. Для демократии же она становится почти неотличимой от единицы ещё при средней вероятности по всему множеству, равной 0,75.
Это определяет наличие диапазона средней по множеству вероятности, при которой вероятность правильного решения на всём множестве вопросов путём голосования столь велика, что оказывается недостижимой для диктатора. Причём теперь уже не «практически», а принципиально: если средняя вероятность правильного ответа по всему множеству для коллектива больше примерно 0,65, то вообще не существует такого диктатора, который мог бы быть с сравним с этим коллективом при той же величине разброса вероятностей - для этого среднее по вероятностям должно было бы оказаться больше единицы.
Правда, вблизи правого края графика в любом случае нормальное распределение оказывается сильно урезанным, что делает его весьма слабо похожим на нормальное - лишь на его фрагмент. В связи с этим «невозможную» область следует полагать ещё более обширной.
Чтобы - в случае попадания коллектива в этот диапазон - «стать возможным», диктатору пришлось бы не только довести среднюю вероятность правильного ответа на вопросы по всему их множеству почти до единицы, но и снизить разброс этих вероятностей. Что, фактически, подводит его к «всегда отвечать правильно на все вопросы вообще».
Если взять среднеквадратическое отклонение побольше, например, 0.2, то оба графика будут сильнее отклоняться от единицы.
Однако «демократический» график всё равно будет заметно выше «диктаторского». И область «невозможности аналогичного диктатора» здесь тоже есть (около 0,69 по оси Икс).
График «преимущества демократии» - то есть разности вероятностей для коллектива и для диктаторов при одних и тех же параметрах - на всём множестве вопросов, в зависимости от среднего по всему множеству (μ) и среднеквадратического отклонения (σ) выглядит вот так (синим снова помечена нулевая плоскость).
Таким образом, и на полном множестве вопросов тоже демократия приводит к тому, что в среднем правильные решения будут приниматься заметно чаще, чем при диктатуре.
Да, действительно диктатор иногда будет выбирать правильно там, где ошибся бы коллектив, однако это будет происходить заметно реже, чем наоборот. Причём так будет даже в ряде тех случаев, когда средняя для диктатора вероятность правильно угадать на всём множестве вопросов заметно выше, чем у каждого из членов коллектива.
Конечно, вполне возможно, что диктатор не ошибётся в чём-то критическом, когда коллектив, подверженный именно в этом вопросе заблуждению, ошибётся. Но, опять же, и в критических вопросах может случиться прямо противоположное. И если средняя по всем критическим вопросам (а не по какой-то их локальной группе) вероятность угадывания в коллективе всё-таки выше ½, то именно коллектив будет чаще угадывать и в критических вопросах тоже.
doc-файлпубликация на сайте «XX2 Век» 1 публикация в блоге автора 1публикация на сайте «XX2 Век» 2 публикация в блоге автора 2публикация на сайте «XX2 Век» 3 публикация в блоге автора 3 публикация в блоге автора 3 (окончание)