Автоматизация теперь проникает и в сферу журналистики. Искусственный интеллект пишет заметки, рассказывает новости и показывает именно те статьи, которые вам интересны. Но не зайдут ли технологии слишком далеко?
Если вы смотрели новости китайского информационного агентства «Синьхуа», вы могли заметить нечто странное. Ведущая новостей Син Сяоменг рассказывает обычные новости. Но в ней есть что-то ненастоящее - в буквальном смысле этого слова. Син Сяомен - цифровое изображение, созданное при помощи машинного обучения.
Таких ведущих новостей в Синьхуа много: все они безоговорочно рассказывают то, что им велят, не уставая и не протестуя. Для страны, которая уже держит своих журналистов на коротком поводке, это важное развитие. Автоматизированная журналистика кажется еще одним способом контроля правительства в Пекине над распространением информации.
Пока речь Син Сяоменг пишет человек, а интеллект системы может только переводить текст в речь. Чтобы действительно понять, как ИИ меняет новости, нужно посмотреть, как он работает за кулисами.
Click to view
Автоматизированные репортажи
В январе этого года газета The Guardian опубликовала статью о политических пожертвованиях в Австралии, указав ее автором ReporterMate - «экспериментальную автоматизированную новостную систему», которая может анализировать определенный набор данных и в ответ производить тексты. Разработчик системы Ник Эвершед утверждает, что «в новостных организациях работает мало людей, но им все равно нужно выпускать множество статей», и что ИИ-редактор может помочь с рутинными историями, освободив время для людей и позволив им работать над важными расследованиями.
Тем не менее, привлекательность ИИ заключается не только в том, что он заполнит пробелы, появившиеся после массовых увольнений. Используя искусственный интеллект, «мы смогли выпустить истории, которые не выпустили бы до этого сами», - говорит Джереми Гилберт, директор по стратегическим инициативам в Washington Post. Последние несколько лет газета тоже экспериментировала с автоматизацией - в частности с технологией Heliograf. За время Летних Олимпийских игр в 2016 году Heliograf смог написать сотни коротких отчетов и репортажей. Во время выборов в США в 2016 году с его помощью Washington Post написала 500 заметок о политической гонке.
Алгоритмическое кураторство
Все становится намного сложнее, когда нужно решить, как подать аудитории сгенерированный машиной контент. Вместо того, чтобы заполнять первую страницу сотнями статей о политических гонках, Washington Post определяла местонахождение пользователей и предлагала им соответствующие материалы. Например, если читатель проживал в Пенсильвании, то сайт показывал ему статьи, написанные ИИ о местных политических событиях.
«Мы хотим предлагать истории, которые заинтересуют именно вас, на основе информации, предоставленной нам вами», - говорит Гилберт.
Рег Чуа, главный операционный директор редакции Reuters разделяет это мнение. «Мы всегда писали новости, опираясь на концепцию о том, что мы пишем что-то и публикуем это для как можно большего числа людей. Это модель вещания для всех одновременно и поиска истории, которая понравится как можно большему числу читателей», - говорит он.
Однако Чуа задается вопросом, что произойдет, если освещение организации будет настолько всеобъемлющим, что эту модель можно будет опровергнуть? «Если я хочу написать статью о школах в Великобритании и о том, как у них идут дела, читатель захочет узнать, как идут дела у школы, в которой учится его ребенок, - говорит Чуа. - Могу ли я написать эту часть, используя комбинацию ИИ и автоматизации, чтобы вы могли прочитать уникальную историю?»
Спортивные и политические результаты, цены на недвижимость, школьные отчеты - это довольно безопасные области для искусственного интеллекта, чтобы тот составил сотни небольших докладов и предложил их «правильным» читателям. Но может ли персонализация зайти слишком далеко и усилить наши существующие интересы и мнения, вместо того, чтобы предоставлять важную новую информацию, выбранную опытными редакторами?
Джош Кроулс, научный сотрудник в области этики данных, предупреждает: «Существует опасность, что даже в одной публикации тонкая настройка того, что люди видят в отражении собственных интересов и предпочтений, создаст эффект комнаты с сильным эхо».
Оригами-журнализм
Помимо всего прочего, системы ИИ могут также решать, какую информацию показывать в отдельных историях. Гилберт утверждает, что его интересует, как можно использовать машинный интеллект, чтобы изменить архитектуру статей в зависимости от известной информации о читателе.
Он приводит в пример ситуацию в Венесуэле. «Некоторым мы должны рассказать, что сделал Мадуро или переправились ли грузовики с помощью через границу. Эта информация важна для определенных людей, потому что они следили за историей. С другой стороны, если они не обращали на это внимание, мы должны сказать им, кто замешан в ситуации, почему это серьезная проблема и как долго это уже происходит», - говорит Гилберт.
Думайте о статье не как о статическом тексте, а как об оригами со скрытыми и развернутыми секциями.
В этом случае ИИ становится редактором, который перефразирует параграфы для разных глаз. «Это абсолютно меняет отношения между репортером, редактором, новостями и аудиторией», - говорит Гилберт.
Но в лучшую ли сторону? В какой момент персонализация ИИ перейдет черту и перестанет быть полезной и удобной и станет громоздкой, даже запутывающей?
Чтобы алгоритм определил, какую версию статьи показывать читателю, ему нужно понять, что человек уже знает по этой теме. Можно воспользоваться историей браузера, но возникнет юридический вопрос о том, как этот сбор данных будет согласовываться с законами вроде Общего положения о защите данных в Европе, в котором установлены строгие правила касательно использования личной информации частными компаниями. Насколько далеко должна зайти газета, чтобы составить представление о знаниях человека? Одно дело - спрашивать читателей о темах, которые им интересны, чтобы предлагать им похожие истории; так уже делают многие организации, включая Medium. И совсем другое - использовать машинное обучение для сбора интересов читателей, вероятно, даже без их ведома.
Исследователь Лукас Грейвс согласен с тем, что изменив содержание статей в зависимости от того, кто их читает, мы «действительно бросим вызов традиционной новостной этике». Редакторы сегодня на основе личных суждений выбирают, куда включить какую информацию, так что для редакций было бы радикально передать эти полномочия компьютерам.
Машинное расследование
Вероятно, наиболее значимая роль машинного обучения заключается не во влиянии на аудиторию, а в поиске материала, над которым будут работать люди.
Издание Reuters разработало ряд систем сбора новостей на основе ИИ, включая News Tracer, которая предназначена для выявления последних событий путем сканирования Twitter. Ее алгоритмы ищут группы твитов, посвященных одному и тому же событию. Она оценивает достоверность информации, основываясь на ряде факторов, в том числе на подписчиках аккаунта, структуре твита и на том, проверена ли учетная запись.
Еще один проект Reuters - Lynx Insights - ищет большие наборы данных вроде спортивных результатов, отмечает тренды и аномалии и даже составляет несколько предложений, прежде чем передать материал журналисту. Lynx Insights чем-то напоминает личного аналитика данных.
«Вероятно, самая полезная вещь, которую может делать ИИ - это анализ данных. И в будущем можно объединить все это воедино. Вы автоматически анализируете данные, а затем превращаете это в историю, и тоже автоматически», - говорит Чуа.
Скорее всего, эти автоматизированные процессы в итоге будут связаны друг с другом. Система вроде Lynx Insights сможет автоматически искать потенциальную историю, делиться этими данными с ReporterMate, а затем передавать материал Син Сяоменг, которая зачитает новость по телевизору. И в этом никак не будет задействован человек.
Будем надеяться, что мы не увидим такой антиутопической автоматизации. И Чуа, и Гилберт признают, что все это находится только на стадии эксперимента, и сама технология недостаточно развита для того, чтобы заменить редакторов. «Журналисты пока еще нужны», - пишет Эвершед.
Тем не менее, мы все равно должны действовать осторожно. Крайне важно следить за тем, что описывается в отчетах, созданных машинами. Читатели, в конце концов - это только люди.