Comments | _adept_: Распознавание и анализ разговоров

_adept_

Распознавание и анализ разговоров

Jul 05, 2012 07:45

В продолжение вчерашней дискуссииДопустим, мы как-то распознаем разговоры и сохраняем получившийся текст. Я намерено не хочу сейчас касаться ни качества "аудио", которое придется распознавать, ни качества получающегося в результате текста. Пусть даже тут у нас все будет идеально ( Read more... )

gsm, ужос

Comments 92

africanec July 5 2012, 07:11:29 UTC

Не о чем discuss.
Достаточно дать любому параноику часов 5 телефонной прослушки и заставить разобрать по абонентам и расшифровать в текст.
Просветление наступает через полчаса-час даже у самых упертых.

norguhtar July 5 2012, 07:39:08 UTC

Да вон уже на примере китая продемонстрировано, что великий китайский фаервол прошибается, при наличии желания.

(The comment has been removed)

norguhtar July 5 2012, 10:34:57 UTC

Это все понятно. Но если до конца проводить аналогию, то тут скорее закрывание двери на щеколду.

(The comment has been removed)

Thread 13

stranger_p_a July 5 2012, 08:13:22 UTC

Всё верно, но только если рассматривать проблему отдельно. А если в комплексе - картина совсем другая: допустим, натравливаем классификатор на уже отобранную по каким-то другим критериям целевую группу абонентов (например, "люди, активно засветившиеся в "ВКонтакте" в предмитинговой активности") - по этой подгруппе поиск и классификация будут на порядки более результативны.

То есть, сам по себе метод даёт немного, но в комплексе с другими - очень полезен, ИМХО.

_adept_ July 5 2012, 08:35:38 UTC

А как связать людей из вконтакта с номерами/imsi/... ?

jonni July 5 2012, 08:52:15 UTC

Специально обученные Кровавым Режымом гномики помогут, что вы как маленькие прям

;)

xoma_xoma July 5 2012, 09:40:13 UTC

Если у Кровавого РежЫма есть таке гномики, то что стоит оному РежЫму этих же гномиков сразу посадить на прослушку, тем самым избежав ненужных финансовых затрат на аппаратуру и программы?

Thread 45

aamonster July 5 2012, 08:53:11 UTC

Про supervised/unsupervised методы: если делать двуслойную сеть - первый слой сеть Кохонена, второй - звёзды Гроссберга, то при изменении критериев переучивать придётся только второй слой, а это заметно "дешевле".

Про чтение постфактум - если есть полная база "какой телефон когда с каким коннектился" - можно попробовать вытянуть хоть что-то. Если добавить к этому распознавание голоса (ну, основы) - то ещё хоть что-то.

В общем, выхлоп со всего этого можно получить, но он практически не зависит от тайности такой прослушки.

barch July 5 2012, 09:04:13 UTC

если говорить про "базу разговоров" и привязке отдельных разговоров к определенным личностям, тут я бы рассматривал задачу не изолированно от других источников информации, а в контексте всех доступных средств идентификации говорящих
в таком случае задача хоть и добирает вычислительной сложности, но выход становится значительно более достоверным
однако даже в этом случае вопрос "нахера весь этот цирк?" все равно остается актуальным
даже если предположить, что оно таки кому-то надо, то кроме распила бабла на оборудование и развертывание такого комплекса в госмасштабах, ничего другого в голову не приходит. целевое слежение за отдельными особами и агентурная работа - метод более эффективный и, что важно для суда, законный