Пришло время маленьких каминг аутов.

Feb 04, 2021 02:45







Андрей Шипилов

Пришло время маленьких каминг аутов.

Я часто говорю, что "профессионально работаю с информацией", не уточняя, что это значит.

Так вот, в основном это касается возможности извлекать информацию оттуда, где ее, казалось бы в принципе быть не может. Я называю это деятельность "журналисткими расследованиями", но лишь потому, что у меня есть корочка журналиста. На самом деле это "не противоречащий закону промышленный и политический шпионаж"



Как пример такого "расследования" могу привести недавний мой пост о том, насколько дыряв "сверхнадежный мессенжер Signal".

Одной из составных частей этой "профессиональной работы с информацией" (не самой важной, но крайне необходимой) является разработка аглгоритмов автоматического анализа и извлечения добычи из любой доступной в сети информации (не важно в виде текстов ли, аудио или видео).

Это не профессия, это хобби, но хобби с очень неплохим практическим выхлопом. Некоторые айтишники в России до сих пор думают, что я "сеошник", только потому что созданные мною алгоритмы взаимодействия с поисковиками и сейчас лежат в основе многих автоматических SEO-сервисов.

Я в последнее время иногда упоминаю, что у меня на аккаунте работают скрипты автоматически, выявляющие и банящие тролей. Вот эти скрипты - результат одной из последних разработок.

Чтобы картина стала еще более ясной, о чем идет речь. Гляньте на эту демку по ссылке. Там очень маленький кусочек, совсем крохотный, от технологии, над которой я сейчас работаю.

https://fll.ru/yt/

Скрипт по этой ссылке делает очень простую вещь. Это своеобразная "распознавалка речи". Вы указываете в поле слева адрес интересующего вас видео на ютьюбе, и тут же получаете "расшифровку звука" из этого видео в текстовом формате.

Теперь не надо тратить время на прослушивание часового ролика, чтобы узнать о чем там говорится. Нажал кнопочку - и прочитал все в текстовом виде.

Пока это работает не со всеми видео, зависит от настроек конкретного ролика, но 80% видео для анализа доступно и это практически 100% всех частных и блогерских видео. Проблемы пока только с корпоративными.

Или вот эта демка https://fll.ru/ (поле "проверка текста на уникальность").

Тут мои друзья и пернеры взяли очень маленький кусочек технологии, чтобы приспособить его для своей узкой цели, для поиска дублей украденных текстов в интернете.

А полная версия алгорттма позволяет найти начальный источник или точку вброса абсолютно любой информации, зачастую даже не опубликованной (пока только на русском). Именнопоэтому я знаю, кстати, откуда Навальный берет результаты своих расследований, а вы - нет



И на подходе уже технология, позволяющая на лету автоматически(!) определить, правдива распространяемая информация или нет, и даже, кто именно врет и в чьих инетерсах.

К чему я все это рассказываю. Мне нужна помощь публики для доступа к информации с фейсбука. Он сейчас закрутил гайки и обычным путем, через АПИ ее получить нереально.

Хочу предложить сделку. Как вам вот такая идея. Я даю вам расширение для хрониума, которое будет показывать вам, кто из ваших комментаторов является ботом, эсемемщиком и вообще, сидит на фейсбуке за деньги. Ну будет как-то выделять их, цветом, подчериканием или какими-то значками.

А вы взамен позволите расширению собирать и сохранять в нашей центральной базе информацию об этих подчеркунтых товарищах и самый необходимый минимум о вас (примерно такой же объем, который собирают приложения авторизации через фейсбук). Я не уверен, что такое расширение гугл и майкрософт позволят положить в их официальне сторы, поэтому распространяться оно будет частным образом и устанавливать в браузер его придется вручную, по прилагаемой инструкции.

Соотвестенно вопрос. Многие ли из вас согласились бы на такую сделку. Возможность видеть тролей, в обмен на предоставление информации.

Просто пишите в комментах, да или нет. Можно развернуто, почему.

P.S. Не забывайте, выясленный и забаненый тороль не сможет подать жалобу на ваш аккаунт и забанить вас.



Facebook post

Мнение, Шипилов, интернет, it, технологии

Previous post Next post
Up