(Далее просто мысли, без определенных намерений сделать реальностью)
Исходники описания морфологии и синтаксиса русского языка можно включить в ознакомительную версию SDK. Туда же добавить компилятор словаря.
Это позволит любому разработчику править русскую морфологию в определенных рамках, а именно - добавлять новые правила. Сам язык описания правил достаточно прост и не поставит в тупик человека, знакомого с C# или тем более JavaScript. Самый сложный момент там - смесь декларативного стиля для задания правил, императивного стиля для пользовательских функций, и (ну куда же без них) некоторого функционального, особенно что касается использования безымянных функций и замыканий. Кстати, там нет ООП, хотя такие мысли есть для определенных практических задач.
Конечно, доступ к исходникам морфологии даст негативный побочный эффект - наличие несовместимых реализаций русской морфологии, частично решающих разные частные случаи в разных сочетаниях. Чтобы минимизировать этот негатив, можно было бы сделать некий общий репозиторий для файлов русской морфологии, на базе любой бесплатной системы контроля версий, начиная с динозавра типа SourceForge до чего-то модного типа гита. Само собой, возникнут новые проблемы - кому давать право на внесение изменений в основной транк, и так далее...
Кроме общего доступа к правилам морфологического анализа для русского языка, есть и другая возможность, которая мне кажется более интересной: возможность описания морфологии, лексики и синтаксиса новых языков. Сейчас из открытых есть русский и английский разделы словаря. Есть языки, реализация которых закрыта по условиям NDA, поэтому я их касаться не буду. Но целый набор языков просто ждет своего часа, чтобы быть сделанными. Для французского языка сделано базовое объявление всех частей речи, их грамматических признаков, и начало заполнение лексикона, несколько тысяч статей. Для китайского языка проверена практическая возможность реализации.
И вот тут было бы интересно сделать такой вариант "ознакомительного SDK", который с одной стороны содержал бы необходимый набор инструментов для создания новых языковых разделов, а с другой - не вступал бы в конфликт с коммерческим вариантом SDK.
Какие инструменты нужны для создания и поддержки нового языкого раздела: 1) компилятор словаря, 2) консольный пошаговый отладчик. 3) файлы-образцы с описанием морфологии русского и/или английского языка 3) командные скрипты для выполнения сборки словаря.
Коммерческая версия давала бы такие бонусы, как расширенный русский лексикон, протестированный на эталонном корпусе набор правил морфологического анализа, возможность расположения словаря в MySQL.