Случилось так, что до сих пор нигде не опубликован нижеследующий текст. А ведь он важен! По существу это текст о том, как из обломова и манилова стать Человеком, и как боты в этом могут помочь. Так что пусть будет хоть в ЖиЖе.
Чем большее количество контента в Интернет генерируется пользователями, тем актуальнее становится для них поиск релевантного. То что одним представляется интересным и важным, другим - «терабайтами чепухи» и наоборот. При этом важна как принадлежность субъекта к какой-либо соц. группе, так и субъектность данной группы. В рамках изучения проявления коллективной субъектности в дискурсе интернет сообществ было обнаружено одно из них, поставившее целью превратиться в субъект оф-лайн деятельности. Попытка провалилась вследствие того, что огромные «пласты» социальной жизнедеятельности - конгломераты тем, связанных, прежде всего, с профсоюзной активностью и деятельностью территориальных общин и поселений - оказались вне интереса основного контингента участников обсуждения. В результате сообщество не пересекающееся IRL не нашло предмета для объединения и проект угас. Отслеживание дискурсивной активности участников в других темах позволило выявить такую ее характерную черту как псевдосубъектность, иллюзорную субъектность в отличие от истинной субъектности.
Может быть предложено следующее разграничение истинного и иллюзорного коллективных субъектов: насколько говорящий от имени «мы» может действовать от имени «мы»? Какие именно ему и таким, как он, действия доступны? Ведь и рядовой житель может говорить «мы», имея ввиду «страну» (в рассуждениях на внешнеполитические темы), ее высшее руководство и т.п., к решениям которых он заведомо не имеет никакого отношения, выступая лишь как (потенциальный) ресурс для правящей бюрократии. Подлинным субъектом будем называть субъект действия, т.е. тех актов, которые данная совокупность людей может совершить в настоящее время, независимо от чьей-либо еще воли. Потенциальным субъектом будем называть субъект тех действий, которые может выполнить данный субъект, совместно с другими такими же, независимо от чьей-либо еще воли, либо, как-то убедив, другие субъекты согласиться с ним в таком-то вопросе. Псевдосубъектностью, иллюзорной, партиципативной, субъектностью идентификации будем обозначать все остальные. Главным вопросом в отношении коллективного субъекта является осознание этим субъектом себя. В вербальной плоскости коллективный субъект, как правило, обозначается местоимением «мы». Соответственно, самый главный вопрос, насколько четко, расшифровывается, кто именно «мы»? Насколько эти «мы» отличаются от не «мы». Вместе с тем возможны и безличные конструкции типа «следует», «необходимо», «нужно», могущие относиться как к доступным говорящему, так и совершенно недоступным для него действиям. Поскольку коллективный субъект либо плохо, либо наоборот слишком хорошо осознается говорящим, прямые расшифровки в тексте, сразу за «мы», встречаются довольно редко, хотя и эксплицируются по мере развертывания дискурса. Таким образом, истинная и иллюзорная субъектность отличаются как набором действий, так и набором адресатов, что делает проблему автоматизации их оценки потенциально решаемой, пусть и далеко выходящей за рамки поиска единичных слов и выражений. Ключевым для машинного обучения является наличие адекватных выборок текстов. Таковой для подлинных субъектов могут выступать, например, корпуса текстов независимых профсоюзов, территориальных общин и общегражданской тематики. Псевдосубъектность представлена в рунете повсюду, однако имеет как минимум следующие основные жанры: «маниловщина/прожектерство» (как бы надо все устроить), «утешения/запугивания», «плачи/обвинения/жалобы», (нарцистические нарративы о могуществе различных субъектов, с которыми возможна или, напротив, невозможна идентификация адресата). Первый жанр имеют адресатом что-то вроде воображаемого могущественного и благоволящего государя, второй - индивидуального субъекта примерно равного по статусу говорящему, а третий и то, и другое. Предварительный экспертный анализ показывает, что, для профсоюзного дискурса характерна, прежде всего, тематизация непосредственного начальства - «Руководство больницы», «главврач», «администрация», «директор», различных выплат трудящимся, а также самого профсоюза. Тематизация классов и социальных групп говорящих - «чиновница отругала», императивы второго лица «вступайте в профсоюз!» А также ссылки на законы и проч. акты, акронимы - ТК, УК, КЗоТ, линки на базы данных по законодательству. При этом все тексты как истинной субъектности, так и псевдосубъектности любого жанра перегружены импликациями, т.е. подразумеваемыми, но не содержащимися в текстах явно содержаниями. Например, «медиков не предупредили» (имеется в виду трудовой коллектив, но ведь главврач тоже медик). «Мы что, расходный материал?» и т.д. и т.п. Из сказанного вытекает невозможность надежной оценки субъектности сообщений по малому числу текстов и, следовательно, необходимость анализ максимально возможного числа текстов одного типа. Для углубленного изучения текстов продуктивным представляется латентный семантический анализ, включающий «мы» и пересекающиеся темы, (экспликаиця «мы») и латентное распределение Дирихле, не включающее «мы» и пересекающиеся темы. Дополнительную проблему представляет развитая морфология русского языка, без адекватной обработки которой реконструкция суждений (на определенных уровнях обработки) едва ли будет возможна...