Моя борьба или про распознавание шок-контента алгоритмом Яндекс.Дзен

Sep 12, 2018 22:30

Пока не забыл, по горячим следам опишу мою историю попытки разрулить с техподдержкой очередную пессимизацию со стороны Дзена.
Все началось с публикации 10 сентября 2018 года поста "Пулемет и советский пулеметчик глазами немецкого фотографа".


С первых показов стало понятно что пост зашел очень хорошо. Кривая посетителей в Метрике в 14-30 по местному времени  резко прыгнула вверх со стандартных 500 чел. в декаминуту до 1700 с хвостиком чел. и замерла примерно на этом уровне. Через 2 часа она стала очень медленно снижаться (что естественно), но по всем показателям было ясно, что "Пулемет" это кандидат на лучший пост года и не только по "скороподъемности".




День 10 сентября принес мне в итоге 96 тыс. с хвостиком посетителей, что было абсолютным рекордом года и + 2 тыс. рублей чистыми к стандартной сумме дневного заработка в последние 2 недели (я даже стал подумывать, о том, что пора уволняться с основной работы). Помимо всего прочего пост собрал под сотню комментариев, но это отдельный сюжет стоящий специального анализа. Скажу только, что я никак не думал, что там будет такой такой АД!
Как оказалось, я рано радовался...

Ровно в 22-10, через 8 часов и 10 минут кривая посетителей блога стал резко падать и в течении 1 часа и 10 минут опустилась ниже отметки в 500 постителей в декаминуту. Тем не менее пост собрал до конца суток 50 тыс. просмотров. Далее, с переходом на новые сутки, выяснилось, что пост опустился сначала на 5 место в моем ТОП-10 постов, а к концу суток и вовсе на последнее и его место заняли посты чуть ли не двухнедельной давности. Посещаемость блога упала ниже 400 чел. в декаминуту (вечерняяслабаявспышка связана с публикацией очередного поста), все остальные параметры поста перестали расти, а лайки и вовсе на десяток почему-то сократились. Вся эта ситуация явно свидетельствовала о введении в отношении меня каких-то санкций и я написал в службу поддержки Дзена письмо спросьбой прояснить ситуацию.



На что спустя несколько часов получил ответ, что пост ограничен к показу, т.к. содержит шок-контент и ссылку на разъяснения о том, что является шок-контентом.

На что я ответил и попросил пересмотреть ранее сделанные выводы в режиме ручного управления,т.к. здесь явно какое-то недоразумение.

Уважаемая ****, добрый день.
Спасибо за ответ.
Я попрошу Вас еще раз внимательно ознакомиться с содержанием статьи.

Ее цель не привлечь читателей путем намеренной демонстрации трупов красноармейцев на фотографиях из немецких альбомов. А поделиться результатами исторического анализа редких кадров простых солдат Вермахта на основании которых вместе с читателями можно попытаться реконструировать эпизоды применения станковых пулеметов в РККА в условиях отступления лета 1941 года. Кроме того, эта статья для более широкого круга читателей демонстрирует всю трагедию начального периода Великой Отечественной войны и героизм неизвестных советских солдат отдавших жизнь за Родину. Это нашло живой отклик в комментариях моих читателей и ни кто из них не обвинил меня в излишней натурализации темы не смотря на различные точки зрения.

Да война это жестоко, но в данном случае это документальные кадры без крупных планов. В документальных кадрах по федеральным каналам российского ТВ демонстрируют гораздо более шокирующий контент на тему жертв войны, холокоста, казней гражданского населения и прочего. И вот ту возникает вопрос, документальное фото казни Зои Космодемьянской это тоже шок контентент? А горы трупов у печей в Бухенвальде? Наверное надо все-таки исходить из того с какой целью демонстрируется этот материал и как он подается зрителю/читателю. Нельзя на основании документальных фото обсуждать боевые эпизоды гибели неизвестных советских пулеметчиков со стыдливо полузакрашенными фотографиями. Это как минимум неуважение к тем кто отдал жизнь за нашу Родину.

Я надеюсь что модераторы Дзена еще раз внимательно ознакомятся с контентом и вынесут взвешенное решение. В дальнейшем я постараюсь воздерживаться от публикаций на историческую тему, если алгоритм Дзена на столько не совершенен (это надо как-то исправлять).

С наилучшими пожеланиями и надеждой на понимание, Старков Алексей (starcom68)

Дзен взял длительную паузу и на следующее утро мне пришлось напомнить о себе.
Ближе к вечеру я получил ответ в котором приносились стандартные извинения за длительное ожидание в связи с увеличением времени обработки писем из-за большого количества запросов.
Далее следовало несколько ключевых моментов которые я приведу дословно:

"Система работает в автоматическом режиме и нам приходит отчет, у нас нет возможности вручную влиять на количество показов и снимать ограничения. Алгоритмы Дзена настроены согласно тем требованиям, которые мы описали в разделе помощи. При исправлении нарушений и добавлении новых публикаций вы всегда можете ориентироваться на эти правила. Дело в том, что публикация не заблокирована на Дзен, а ограничена в показах, так как некоторые материалы в ней могут напугать или шокировать читателей. На мой взгляд, фотографии могут подходить под этот пункт. Однако, мнение сотрудника может отличаться от решения системы."

Все очень грамотно и корректно, только мне не ясно как Дзен спустя 8 часов распознал шок-контент на чб фото где иногда при большем опыте и знании контекста и то не все разберешь. А главное: почему это он не распознал сразу, а лишь через 8 часов и после 50 тыс. просмотров и 100 тыс. посетителей. Вот почему он сначала решил что это нормальный пост и выдал свыше полумиллиона показов, а через 8 часов передумал и остановил показы, найдя шок-контент? Что подтолкнуло его к этому?

Со свойственным мне занудством я написал новое письмо в техподдержку:

***, добрый день. Спасибо за ответ.
Я плохо понимаю, как алгоритм Дзена в данном конкретном случае "видит" на чб фото шок контент, когда даже лиц не видно и на некоторых фото вообще не понятно ветошь, куст или человек. Да, современные средства распознавания могут узнавать человека или "видеть" порнографию, но они еще не научились интеллектуально анализировать документальные фото. Если у Дзена это так, то это открытие. Я склоняюсь к мнению, что Дзен среагировал на ключевые слова в комментариях, которых я избегал в тексте поста. Не так ли?
И еще скажите, стоит ли мне убирать фото с трупами ради снятия ограничения в показах. Как быстро алгоритм Дзена поймет, что фото убраны и восстановит показы. И поймет ли вообще? Ведь по моему мнению он среагировал на тексты в комментах.
Что посоветуете? Мне это важно чтобы понять как поступить с этим постом и не допускать подобных досадных ошибок в дальнейшем...

Ответ

...Вы можете исправить те материалы, которые не соответствуют нашим рекомендациям к контенту (это и фото, и комменты, то, что подходит под определение шок-контента) и написать мне, чтобы я могла инициировать перепроверку статьи. В течении 1-2 дней система повторно проанализирует материалы и, если все будет соответствовать правилам, снимет ограничения...

Я согласился и обязался исправить, но спросил как я могу править чужие комменты? Получил ответ с извинениями за ошибку и разъяснениями, что чужие комментарии никакого отношения к ранжированию статьи не имеют. То есть, нарушения именно в самой статье.

Так что сейчас 12 сентября в 20-00 я вымарал в фото все то, что может быть воспринято как шок контент и заменил в тексте звездочками слова смерть и убитый.
Теперь сижу и жду результата повторного анализа.
Буду аплодировать стоя, если в течении 1-2 суток алгоритм снимет все ограничения и на третьи сутки опять выдаст полмиллиона показов этого поста.

Для чистоты эксперимента зафиксируем показатели поста на момент написания этого поста:


Расшифрую:
576 тыс. показов в ленте
51,6 тыс. просмотров
47,8 тыс. дочитываний (93%)
964 лайка
3 мин - среднее время дочитывания.

Когда Дезен меня пессимизировал показатели были следующими:

568 тыс.показов в ленте
50,1 тыс.просмотров
46,6 тыс.дочитываний
948
3 мин
Т.е. слабо, но показы все-таки идут. Действительно как и сказала техподдержка это не бан, а ограничение в показах. Т.е. в дальнейшем, если показы резко упали, но не исчезли совсем, надо проверятьвалидацию поста в техподдержке.И еще одна странность. Метрика на 10 сентября дает 52,68 тыс. просмотров поста, а в карточке поста на момент написания этого текста трое суток спустя их почему то стало 51,6 тыс. Как такое может быть?

Получу какой-то результат - сделаю здесь UPD
****************************************************************

Итак, долгожданный UPD.
Напомню, после того как вчера в 20-00 я вымарал все что может шокировать Дзен, написал письмо о содеянном в техподдержку: Можно иницировать перепроверку. С нетерпением жду результатов и мой партнер Михаил Тух тоже, а то вся эта история уже двое суток как причиняет нам невыносимые моральные страдания, которые могут привести к расстройству здоровья.

Вероятно, мои жалобы на предчуствие ухудшения здоровья произвели должный эффект и в 23-30 кривая посещений блога скакнула вверх с 500 до 1120 чел. в декаминуту, счетчик показов завертелся, а в 0 часов 09 минут я получил сообщение от техподдержки, что ограничения сняты. Сейчас процесс продолжается и к полуночи я подведу некие итоги, но уже сейчас ясно, что вставать и стоя аплодировать Дзену не стоит, т.к. интенсивность показов более чем в два раза ниже чем было до пессимизации. Прошло уже 18 часов, а показов добавилось только 800 тыс., тогда как за первые 8 часов до пессимизации было 0,5 млн.

Яндекс, Соцсети, Дзен

Previous post Next post
Up