Comments | piramidon: (без темы)

piramidon

(Untitled)

Jan 08, 2016 13:24

После кёльнских событий высказываний по поводу того, что делают мусульмане и арабы с Германией и западным миром, стало ещё в разы больше. Я к большинству этих высказываний (практически всех за последние дни) отношусь скептически, но речь не об этом. При всём шуме мне пока что не попадались конкретные предложения по изменению ситуации ( Read more... )

политика, философия, злоба дня

Leave a comment

Back to all threads

graf_vk January 8 2016, 23:12:15 UTC

(дисклеймер: я пишу не совсем то, что думаю, чтобы более артикулированно обозначить позицию.)

Я не понимаю, чем плохо правило "не пускать мусульман".

Да, меня не волнует, во что они верят, но есть факт: мусульманское вероисповедание коррелирует с тем, что человек окажется "проблемным" (допустим я это проверил какой-нибудь полицейской базе преступлений и корреляция действительно есть и значительная).

Тогда "не пускать мусульман" становится вполне неплохим эмпирическим правилом. Да, мы несколько прижмем "свободу" в пользу безопасности, но это тоже совершенно явно измеримая вещь: берем достаточно большую выборку, проверяем сколько "добропорядочных бюргеров" наше правило не пустило бы в страну.

Дальше общество должно принять решение: сколько "ошибок" искупаются предотвращенными проблемами. То есть решить "не пустить 10 человек, ради того, чтобы не пустить одного траблмэйкера это ок, а 11 уже не ок". После этого проверяем, насколько правило "не пускать мусульман" нас устраивает.

Ну, и что уж, слава роботам!

Надо квантифицировать "полезность" человека (условно говоря net gain бюджета страны из-за наличия в ней этого человека. Тут надо научиться переводить "напился и дебоширил" в убыток страны от этого в евро, а в идеале и "у нее такой красивый сад, что все соседи в восторге" в прибыль, но кажется, что это вполне решаемая задача, по крайней мере решаемая с достаточной точностью). А после этого просто берем для всех кучу информации о них (возраст-пол-страна рождения-гражданство-образование-любимый цвет). И запускаем какой-нибудь алгоритм машинного обучения, который предсказывает эту "полезность" или классификатор, который отличает "положительных" граждан от "отрицательных". Кажется, что данных для этого накоплено достаточно, иммиграция в Германию немаленькая.

И "отрицательных" (или более отрицательных чем определенный уровень -- тут надо свериться с нашей метрикой свободы-безопасности) не пускаем. Ну, окажется, что нельзя пускать мужчин мусульман в возрасте 18-30 лет, без высшего образования. А в возрасте 30-35 можно, при условии что они знают немецкий или два других иностранных языка. Отличное инструментальное определение. Мы, конечно, ничего не имеем против того, в кого они верят, когда они родились и почему решили устроиться на работу вместо того, чтобы идти в институт, но статистика говорит, что скорее всего проблем от них будет больше, чем возможной пользы.

-------------

В сущности, по меньшей мере в одной части я говорю примерно про то же, про что ты: что надо формулировать не некоторое "правило", а понимать, чего мы хотим (в моем тексте мы хотим оптимизировать метрику свобода-безопасность: не пустить как можно больше траблмейкеров, сохраняя некоторый баланс с тем, сколько людей мы готовы при этом "несправедливо" не пустить).

Мне кажется странным твое требование сформулировать критерий который формулируется в более абстрактных категориях, чем вероисповедание. Потому что то, что человек исповедует религию, "общепринятые тексты которых содержат правила и призывы, противоречащие конституции" меня не волнует так же, как то, что он верит в Аллаха или Макаронного Монстра. Меня волнует, будет ли он петарды запускать.

piramidon January 9 2016, 09:20:01 UTC

Так ты, по-моему, и сформулировал в более абстрактных категориях, чем вероисповедание:

есть факт: мусульманское вероисповедание коррелирует с тем, что человек окажется "проблемным (допустим я это проверил какой-нибудь полицейской базе преступлений и корреляция действительно есть и значительная).

Осталось сделать ещё пол-шага и вместо "мусульмане" так и написать - "религия, членство в которой коррелирует с таким-то коэффициентом с проблемностью, которую мы определяем так". А так всё сходится.

Меня в твоём предложении с технической точки зрения удивляет другое - если ты собираешься делать машинное обучения по с использованием стапятисот параметров, зачем вообще заранее задавать конкретную религию? Просто один из параметров, и всё.

Ну и нетехническое. Беженцев вообще в страну пускают не ради net gain, а по гуманитарным соображениям. Строго говоря, от них по дефолту должны ожидать net loss, иначе их приняли бы и без этого статуса.

graf_vk January 9 2016, 13:59:16 UTC

по поводу последнего (про беженцев) -- да, я это, естественно, понимаю. И это как раз совершенно техническая деталь. В описанной мной картине это решается тем, что факт запрета въезда беженцу считается вредным для общества. То есть граница проводится не по 0 выгоде, а достаточно маленькой отрицательной.

В варианте 100500 параметров, разумеется, принадлежность ко всем основным мировым религиям является несколькими из этих параметров. Первая часть моего комментария (которая до "слава роботам") предполагала, что мы еще не достигли идеала (он же -- технократическая антиутопия, тут как посмотреть), у нас нет хорошего дизайна описанного алгоритма, но мы хотим прямо сейчас решать существующую проблему.

Тут нам нужно в сущности зафиксировать один коэффициент -- отношение ложных срабатываний критерия к количеству верных срабатываний.

И вот в этом месте у нас возникает некоторое расхождение. Ты, насколько я понимаю (поправь меня, если я неправ), говоришь, что формулировать запрет можно только в терминах этого коэффициента. То есть если для какой-то конструктивно описываемой группы людей этот коэффициент оказывается меньше критического им нужно запрещать въезд.

В идеальном мире это хорошее требование (и в каком-то смысле машинно-обученный алгоритм с кучей критериев это движение в эту сторону). Но на практике, это работает плохо, потому что множество критериев очень размыто: можно формулировать очень вычурные критерии. Не вполне понятно, например, нужно ли проверить его для христианства, или для отдельных конфессий, или только для людей, которые бывают в церкви не реже K раз в год (и для какого K?). Проверить все такие группы мы технически не можем -- их бесконечно много, кроме того, чем более вычурный критерий, тем меньше у нас статистики, поэтому проверить их не очень получится.

Но непонятно, почему бы нам не внедрить критерий, который мы уже придумали и который улучшает нашу метрику. Когда придумаем еще какой-нибудь, про другие религии, внедрим и его. Ну или когда придумаем, как улучшить этот.

Кажется, что если у нас зафиксирована метрика, то нет ничего плохого в том, чтобы улучшать ее пошагово. Ну, кроме того, что это кто-то сочтет ксенофобским. Но пусть этот кто-то и проверяет другие религии и находит подходящий критерий: методология у нас открытая.

И да, если кто-то в рамках этой методологии (в которой прописаны допустимые доверительные интервалы и т.п.) нашел группу людей, впускать которых опасно, то закон про них должен приниматься почти автоматически. Возможно с учетом этого требования у нас вообще нет почвы для спора.

piramidon January 9 2016, 14:35:10 UTC

Пока что не понимаю. Я считаю легитимным любое правило, основанное на объективных критериях, которые в принципе применимы к любой группе людей (например, та же "корреляция с тем, что человек окажется проблемным"). При этом я не вижу в этом плане разницы между мусульманами и любой другой группой в плане применимости этого критерия. Нужно ли, скажем, проверить его для ислама, или для отдельных конфессий, или только для людей, которые бывают в мечети не реже K раз в год (и для какого K?). И, кстати, не вижу, почему бы не проверить это для произвольного (конечного) количества религиозных или иных групп разных размеров, если всё равно есть данные.

Или я неправильно понимаю, что ты имеешь в виду под "критерием"?

graf_vk January 9 2016, 20:01:15 UTC

Проблема именно в том, что мы можем применить этот критерий только к конечному числу групп, причем таких, про которых мы догадались подумать.
Если мы не вспомним о секте "свидетели чайника Рассела", то мы их не запретим, даже если по нашей статистике оказывается, что все до одного они -- негодяи.

И тут возникает этический вопрос: вот я придумал закон, про который я знаю, что его применение полезно для общества (в нашем квантифицированном смысле, о котором, будем считать, мы на референдуме договорились). Но обеспечить его тотальное применение я технически не могу. Правильно ли будет начать применять его избирательно, учитывая что это само по себе приводит к улучшению состояния общества в том смысле, о котором общество договорилось. При этом со стороны будет выглядеть как "мы приняли какой-то закон, под который попали только мусульмане и байкеры"

И есть еще одна проблема.

Предположим, что мы сформулировали критерий в духе "если группа людей, которую можно конструктивно описать, удовлетворяет некоторым статистическим критериям проверяемым по заданному набору данных, то мы эту группу как-то поражаем в правах.

Допустим, я отстал от мусульман и решил, что католики тоже не сахар и их тоже надо запретить. Посчитал для них нашу метрику -- оказалось, что все норм. И тут я начинаю выпиливание лобзиком: ограничимся только лютеранами мужчинами. Тоже нет? Ок, тогда лютеране или протестанты, мужчины в возрасте от 20 до 30. и т.п.

В какой-то момент я смогу подобрать такой странный набор качеств, который случайно пройдет наш критерий (в машинном обучении это называется overfit, там есть и свои методы борьбы с этим, но они в основном завязаны на то, что я заинтересован в хорошей работе моей системы. Противостоять агенту, который ищет exploit в системе -- гораздо более сложная задача).

Один из простых (пока мы не дошли до "слава роботам") способов это обойти -- это потребовать, чтобы условие, выделяющее группу людей было простым (скажем не больше трех признаков из набора религия, возраст, пол, семейное положение, образование). И в части "религия" тут придется прямо говорить "мусульмане", "протестанты", "шииты" и т.п., потому что "религия, 90% священных текстов которых содержит не менее 3 признаков нарушения конвенции о правах человека (из прилагаемого списка признаков)" опять превратится в выпиливание признаков лобзиком под заданный ответ.

piramidon January 10 2016, 19:01:39 UTC

Первая проблема меня не особо смущает. Любой закон применяется только к тем про кого догадались подумать (истцы или прокуратура). Если мы не можем, скажем, поймать и посадить всех убийц, это не значит, что мы вообще не имеем права запрещать убийства. Это, собственно, я и имел в виду - следствие ("выгнать мусульман"), которое находится в компетенции исполнительной власти, должно быть последним шагом. В начале должно быть правило. Причём в идеале правило должно формулироваться до того, как мы смотрим на статистику, именно для того, чтобы не подгонять его под отдельные группы.

Вторая проблема, по-моему, скорее техническая. Можно ввести требования к значимости, доверительные интервалы, минимальный размер выборки и ещё кучу всего. Снизить вероятность ошибки (случайного совпадения) до произвольно малой.

Back to all threads