Вопрос, который, наверное, задают себе все в первых числах января. Ну, начнём с чего попроще - жду, что всё-таки прекратится эта наглость по отгрызанию крох и без того крошечных зарплат учёных (ибо под шумок создания "площадки для обсуждения оплаты труда" отгрызли ещё, по самое ниже плинтуса). А если мыслить глобально (потому что в науке от этого никуда не деться)...
Есть кое-какие перспективы, которые мне хотелось бы обдумать. В особенности после того, как в блоге
tacente при обсуждении понятия "языковая картина мира" один из комментаторов сослался на корпусную лингвистику (суть довода состояла в том, что факт "наличия" слова в языке ещё недостаточен для глобальных культурологических выводов - нужен анализ употребления слова, м/б оно вообще гапакс).
Интересные перспективы возможны:
1) Корпусная лингвистика и поэтика жанра. При всём моём преклонении перед Виноградовым, "Словарь языка Пушкина" мне всегда казался довольно бесполезной вещью (ну, может только для историков лексики современного русского языка, к коим я не принадлежу). Ну, знал Пушкин такое слово, а где он его использовал - в лирике, в прозе, в поэмах, в письмах? Примеры, конечно, приводятся, но мало и вперемешку. Вот если бы существовали отдельно "Словарь лирики Пушкина", "Словарь прозы Пушкина", "Словарь поэм Пушкина", "Словарь переписки Пушкина" (не думаю, например, что Пушкин в бытовых письмах употреблял выражения типа "темнокудрявые власы" - цитирую "Руслана и Людмилу"). А потом интересно было бы посчитать, какой процент общий у разных словарей. Можно было бы проследить, как переключалось мышление автора при переходе из одного жанра в другой.
2) Корпусная лингвистика и сравнительно-историческое языкознание. К этому я сейчас подбираюсь. У традиционной компаративистики, при всём впечатляющем характере её достижений (ну хотя бы то, что она обладает достаточно надёжной предсказательной способностью), существует один крупный недостаток: недоучёт того, что лексические единицы берутся из памятников, создаваемых в конкретной культурной среде. По крайней мере, в индоевропеистике дело обстоит именно так - если известно слово, то ничем, кроме фонетических и морфологических соответствий, уже не интересуются. Даже в случае с заимствованиями - констатируют факт заимствования и на этом чаще всего успокаиваются (есть, конечно, специальные работы по заимствованиям, например, о тюркизмах в древнерусском, но они всё равно не привлекают корпусного исследования памятников).
А что было бы интересно посмотреть - это в каких ГРУППАХ памятников встречается данное слово. Например, если какое-то слово встречается ТОЛЬКО в переводных памятниках, то оно почти со 100% вероятностью заимствование или калька. Неважно, что оно может иметь закономерный "родной" фонетический облик - заимствования хоть и опознаются по аномальному фонетическому поведению, однако вовсе не обязательно ведут себя аномально (классический пример - дискуссии о первичности славянского grad- и скандинавского gard- в топонимике; была бы фонетическая аномалия - было бы сразу ясно, кто у кого заимствовал). Плюс ещё народная этимология.
Тут ещё много интересных перспектив всплывает. Зализняк уже кое-что сделал по этой части - составил список слов, которые встречаются только в берестяных грамотах и не находятся в книжной письменности. Есть повод проделать то же с другими корпусами средневековых памятников: какие слова обычны для одних групп, но отсутствуют в других. Самое интересное было бы - корпус рунических памятников (по эпохам); корпус скальдической поэзии; корпус эпоса; корпус исландских саг; корпус позднерунических деревянных табличек. И всё это с системой гиперссылок на другие корпуса.
База данных по руническим надписям в принципе есть - Rundata 2.0, но, то ли потому, что бесплатная, то ли потому, что несерьёзно подошли к делу, устроена совершенно допотопным образом и работать с ней очень неудобно.