Oct 13, 2017 08:48
Школа по digital humanities, на которую удалось попасть на все 4 дня (что было очень здорово и правильно) оказалась настолько насыщенной по плотности новой-забытой-знакомой, но под новые задачи структурированной информации;
по количеству очень умных и часто - очень увлеченных людей;
по спектру интересов и умений этих умных и увлеченных людей;
разнообразию совершенно новых подходов и инструментов,
что к 4 дню голова уже слегка шла кругом.
Это было безумно интересно, очень полезно и важно для меня. Жаль, что не удалось совсем отключиться от повседневности, даже пропустила очень интересную лекцию про то, является ли переведенный Шекспир Шекспиром (во всяком случае, так она была анонсирована).
Первые впечатления таковы:
1. Возможно, стоит поосваивать самую базу программирования, люто ненавидимового со школы. Может, даже не для того, чтобы реально применять - но хотя бы для того, чтобы понимать, как это работает. И сделать это в ближайшее время, пока не потерялись те понимание и ощущения, которые сложились в процессе соответствующего тьюториала.
2. Самое тяжелое для меня было понимание того, что цифровые методы часто (м.б. даже в первую очередь) ориентированы на такой объем текстов, который не прочитать.
И это было очень болезненно - понять, что а теперь ты будешь не искать в интересующих текстах интересующий мотив, а искать интересующий мотив в неинтересующих текстах. Которые ты никогда не прочитаешь. Даже не узнаешь, что они были. Ты не увидишь каждую репрезентацию мотива, тебя в принципе не будет интересовать особенности его функционирования в том или ином конкретном произведении, ты не будешь даже знать, что это за текст... И если ты пропустишь, что в каком-то стихотворении, скажем, опьянение вызывает не спирт, а солнечный свет, то это не будет иметь ровно никаких последствий для твоей задачи - если она корректно поставлена для применения цифрового метода.
3. Применение цифровых методов (и даже наблюдение над тем, как их применяют другие) всерьез трансформирует отношение к материалу, с которым работаешь. Составление грамматик для поиска мотива, вычленение значимого контекста, составление словаря для поиска мотивов, знакомство с RusVectores помогает (я бы даже сказала - заставляет) совершенно иначе расставлять акценты при работе с текстом. Лингвистам, наверное, чуток попроще с этим расщеплением неделимого на все более мелкие компоненты. Но ощущение было, что в голове работает ядерный реактор, а теплоизоляцию пока не завезли.
4. Самообучаемость - ценнейшая вещь, мы работали с программкой, которая этого не умеет, и сразу было понятно, как было бы полезно, если б ее этому научить. Tomita Parser в сочетании с технологией типа того, что используется на RusVectores должна позволять увидеть в тексте (в этот раз - даже прочитанном) то, что без этого инструмента можно только интуитивно предположить (а можно и пропустить). И мне даже кажется, что запрограммировать это должно быть не запредельно сложно, хотя оценить сложность того, чего не умеешь, нелегко.
5. На тьюториале мы разбились на малые группы. И результат получился у групп, где был и тот, кто может писать код, и тот, кто может копаться в словарях, составлять грамматические конструкции и заниматься другими филологическими вещами. Такое сотрудничество оказывается намного более продуктивным, чем совмещение в одной голове и одних руках гуманитарных и цифровых навыков (хотя если пересчитать на человеко-часы, конечно, трудно предсказать).
6. Программа может предложить то, что тебе и в голову не придет, получить результаты, которые и не снились. Но осмыслить результаты, проверить корректность данных, уточнить задачу - все это удел ученого.
7. К концу 3 дня я поняла, чем та же Tomita может быть для меня удобнее, чем карточки (электронные, конечно) с указанием списка ключевых мотивов для последующего использования соответствующих фильтров:
если на 2300 тексте я пойму, что вырисовывается новый значимый мотив, мне уже не надо возвращаться к предыдущих 2299, чтобы проверить их на наличие этого мотива и при
необходимости занести новое ключевое слово - я просто пишу соответствующий код для нового мотива.
8. Для меня главные неудобства Tomit'ы - отсутствие координат в тексте для найденного результата (говорят, это делается, не сомневаюсь, но мы не успели) и пресловутая несамообучаемость.
9. Слова "высокий порог вхождения" - не пустой звук.
Если чего забыла - потом допишу. Если кому есть что сказать - мне будет интересно.