После кёльнских событий высказываний по поводу того, что делают мусульмане и арабы с Германией и западным миром, стало ещё в разы больше. Я к большинству этих высказываний (практически всех за последние дни) отношусь скептически, но речь не об этом. При всём шуме мне пока что не попадались конкретные предложения по изменению ситуации
(
Read more... )
Я не понимаю, чем плохо правило "не пускать мусульман".
Да, меня не волнует, во что они верят, но есть факт: мусульманское вероисповедание коррелирует с тем, что человек окажется "проблемным" (допустим я это проверил какой-нибудь полицейской базе преступлений и корреляция действительно есть и значительная).
Тогда "не пускать мусульман" становится вполне неплохим эмпирическим правилом. Да, мы несколько прижмем "свободу" в пользу безопасности, но это тоже совершенно явно измеримая вещь: берем достаточно большую выборку, проверяем сколько "добропорядочных бюргеров" наше правило не пустило бы в страну.
Дальше общество должно принять решение: сколько "ошибок" искупаются предотвращенными проблемами. То есть решить "не пустить 10 человек, ради того, чтобы не пустить одного траблмэйкера это ок, а 11 уже не ок". После этого проверяем, насколько правило "не пускать мусульман" нас устраивает.
Ну, и что уж, слава роботам!
Надо квантифицировать "полезность" человека (условно говоря net gain бюджета страны из-за наличия в ней этого человека. Тут надо научиться переводить "напился и дебоширил" в убыток страны от этого в евро, а в идеале и "у нее такой красивый сад, что все соседи в восторге" в прибыль, но кажется, что это вполне решаемая задача, по крайней мере решаемая с достаточной точностью). А после этого просто берем для всех кучу информации о них (возраст-пол-страна рождения-гражданство-образование-любимый цвет). И запускаем какой-нибудь алгоритм машинного обучения, который предсказывает эту "полезность" или классификатор, который отличает "положительных" граждан от "отрицательных". Кажется, что данных для этого накоплено достаточно, иммиграция в Германию немаленькая.
И "отрицательных" (или более отрицательных чем определенный уровень -- тут надо свериться с нашей метрикой свободы-безопасности) не пускаем. Ну, окажется, что нельзя пускать мужчин мусульман в возрасте 18-30 лет, без высшего образования. А в возрасте 30-35 можно, при условии что они знают немецкий или два других иностранных языка. Отличное инструментальное определение. Мы, конечно, ничего не имеем против того, в кого они верят, когда они родились и почему решили устроиться на работу вместо того, чтобы идти в институт, но статистика говорит, что скорее всего проблем от них будет больше, чем возможной пользы.
-------------
В сущности, по меньшей мере в одной части я говорю примерно про то же, про что ты: что надо формулировать не некоторое "правило", а понимать, чего мы хотим (в моем тексте мы хотим оптимизировать метрику свобода-безопасность: не пустить как можно больше траблмейкеров, сохраняя некоторый баланс с тем, сколько людей мы готовы при этом "несправедливо" не пустить).
Мне кажется странным твое требование сформулировать критерий который формулируется в более абстрактных категориях, чем вероисповедание. Потому что то, что человек исповедует религию, "общепринятые тексты которых содержат правила и призывы, противоречащие конституции" меня не волнует так же, как то, что он верит в Аллаха или Макаронного Монстра. Меня волнует, будет ли он петарды запускать.
Reply
есть факт: мусульманское вероисповедание коррелирует с тем, что человек окажется "проблемным (допустим я это проверил какой-нибудь полицейской базе преступлений и корреляция действительно есть и значительная).
Осталось сделать ещё пол-шага и вместо "мусульмане" так и написать - "религия, членство в которой коррелирует с таким-то коэффициентом с проблемностью, которую мы определяем так". А так всё сходится.
Меня в твоём предложении с технической точки зрения удивляет другое - если ты собираешься делать машинное обучения по с использованием стапятисот параметров, зачем вообще заранее задавать конкретную религию? Просто один из параметров, и всё.
Ну и нетехническое. Беженцев вообще в страну пускают не ради net gain, а по гуманитарным соображениям. Строго говоря, от них по дефолту должны ожидать net loss, иначе их приняли бы и без этого статуса.
Reply
В варианте 100500 параметров, разумеется, принадлежность ко всем основным мировым религиям является несколькими из этих параметров. Первая часть моего комментария (которая до "слава роботам") предполагала, что мы еще не достигли идеала (он же -- технократическая антиутопия, тут как посмотреть), у нас нет хорошего дизайна описанного алгоритма, но мы хотим прямо сейчас решать существующую проблему.
Тут нам нужно в сущности зафиксировать один коэффициент -- отношение ложных срабатываний критерия к количеству верных срабатываний.
И вот в этом месте у нас возникает некоторое расхождение. Ты, насколько я понимаю (поправь меня, если я неправ), говоришь, что формулировать запрет можно только в терминах этого коэффициента. То есть если для какой-то конструктивно описываемой группы людей этот коэффициент оказывается меньше критического им нужно запрещать въезд.
В идеальном мире это хорошее требование (и в каком-то смысле машинно-обученный алгоритм с кучей критериев это движение в эту сторону). Но на практике, это работает плохо, потому что множество критериев очень размыто: можно формулировать очень вычурные критерии. Не вполне понятно, например, нужно ли проверить его для христианства, или для отдельных конфессий, или только для людей, которые бывают в церкви не реже K раз в год (и для какого K?). Проверить все такие группы мы технически не можем -- их бесконечно много, кроме того, чем более вычурный критерий, тем меньше у нас статистики, поэтому проверить их не очень получится.
Но непонятно, почему бы нам не внедрить критерий, который мы уже придумали и который улучшает нашу метрику. Когда придумаем еще какой-нибудь, про другие религии, внедрим и его. Ну или когда придумаем, как улучшить этот.
Кажется, что если у нас зафиксирована метрика, то нет ничего плохого в том, чтобы улучшать ее пошагово. Ну, кроме того, что это кто-то сочтет ксенофобским. Но пусть этот кто-то и проверяет другие религии и находит подходящий критерий: методология у нас открытая.
И да, если кто-то в рамках этой методологии (в которой прописаны допустимые доверительные интервалы и т.п.) нашел группу людей, впускать которых опасно, то закон про них должен приниматься почти автоматически. Возможно с учетом этого требования у нас вообще нет почвы для спора.
Reply
Или я неправильно понимаю, что ты имеешь в виду под "критерием"?
Reply
Если мы не вспомним о секте "свидетели чайника Рассела", то мы их не запретим, даже если по нашей статистике оказывается, что все до одного они -- негодяи.
И тут возникает этический вопрос: вот я придумал закон, про который я знаю, что его применение полезно для общества (в нашем квантифицированном смысле, о котором, будем считать, мы на референдуме договорились). Но обеспечить его тотальное применение я технически не могу. Правильно ли будет начать применять его избирательно, учитывая что это само по себе приводит к улучшению состояния общества в том смысле, о котором общество договорилось. При этом со стороны будет выглядеть как "мы приняли какой-то закон, под который попали только мусульмане и байкеры"
И есть еще одна проблема.
Предположим, что мы сформулировали критерий в духе "если группа людей, которую можно конструктивно описать, удовлетворяет некоторым статистическим критериям проверяемым по заданному набору данных, то мы эту группу как-то поражаем в правах.
Допустим, я отстал от мусульман и решил, что католики тоже не сахар и их тоже надо запретить. Посчитал для них нашу метрику -- оказалось, что все норм. И тут я начинаю выпиливание лобзиком: ограничимся только лютеранами мужчинами. Тоже нет? Ок, тогда лютеране или протестанты, мужчины в возрасте от 20 до 30. и т.п.
В какой-то момент я смогу подобрать такой странный набор качеств, который случайно пройдет наш критерий (в машинном обучении это называется overfit, там есть и свои методы борьбы с этим, но они в основном завязаны на то, что я заинтересован в хорошей работе моей системы. Противостоять агенту, который ищет exploit в системе -- гораздо более сложная задача).
Один из простых (пока мы не дошли до "слава роботам") способов это обойти -- это потребовать, чтобы условие, выделяющее группу людей было простым (скажем не больше трех признаков из набора религия, возраст, пол, семейное положение, образование). И в части "религия" тут придется прямо говорить "мусульмане", "протестанты", "шииты" и т.п., потому что "религия, 90% священных текстов которых содержит не менее 3 признаков нарушения конвенции о правах человека (из прилагаемого списка признаков)" опять превратится в выпиливание признаков лобзиком под заданный ответ.
Reply
Вторая проблема, по-моему, скорее техническая. Можно ввести требования к значимости, доверительные интервалы, минимальный размер выборки и ещё кучу всего. Снизить вероятность ошибки (случайного совпадения) до произвольно малой.
Reply
Leave a comment