Откуда ноги растут: линейные дифференциальные уравнения История с жордановой нормальной формой была бы неполной, если не объяснять, откуда растут у неё ноги. "Настоящая" линейная алгебра стала нужна не столько для решения алгебраических систем линейных уравнений (это умели делать и Крамер в 18 веке, и Гаусс в начале 19-го). Она понадобилась, когда инженерам и физикам понадобилось массово решать линейные обыкновенные дифференциальные уравнения с постоянными коэффициентами.
Такие уравнения имеют вид
a0 y(n)(x) + a1 y(n−1)(x) + ... + an− 2 y''(x) + an−1 y'(x) + an y(x) = h(x)с постоянными числовыми коэффициентами ak ∈ ℝ. Решение такого уравнения при h = 0 (однородного) имеет вид ⅀ eλkx ⋅ fk(x), где λк - попарно различные корни характеристического уравнения ⅀ an−kλk = 0 (вообще говоря, комплексные), a fk(x) - многочлены от х степени (строго) ниже, чем кратность соответствующего корня λк. Сейчас мы объясним, почему (и что вообще такое экспонента).
Символ дифференциального оператора, он же характеристический многочлен Сознайтесь, после всех разговоров про действие дифференцирования по иксу на "квазиполиномы" описанного вида вы же не будете удивлены? Давайте запишем его с использованием линейных операторов. Пусть D, как обычно, оператор дифференцирования по иксу. Обозначим буквой L "линейный оператор"
L = a0 Dn(x) + a1 Dn−1(x) + ... + an− 2 D2 + an−1D + an E = p(D). Здесь p - многочлен с постоянными коэффициентами, называемый символом "оператора" L. Тогда линейное однородное уравнение выше может быть записано в операторной форме Ly = 0, сведясь тем самым к нахождению векторов с нулевым собственным значением для L. [Ахтунг!]Ахтунг: обозначая многочлен одной буквой p, мы избавляемся от необходимости явно указывать независимую переменную. До сих пор все полиномы у нас были от одной и той же переменной, икса, но эта лафа кончается. Аргумент многочлена p мы просто вынуждены обозначать другой буквой, поскольку икс уже "занят". Стандартного обозначения для этой переменной нет, часто пользуются буквой σ ("символ" же!) и пишут pL(σ). Но, как во всякий многочлен, вместо переменной можно подставить любое число, а как мы видим выше, можно подставить даже оператор или матрицу; так получается оператор L = p(D).
Связь оператора с его символом - очень пуповинная.
Теорема 3. Для любых двух линейных дифференциальных операторов L,M с постоянными коэффициентами символ их композиции (в любом порядке) равен произведению символов операторов:
pL∘M(σ) = pM∘L(σ) = pL(σ) ⋅ pM(σ).
Доказательство. Иной спросит, а чё тут такого-та? А такого тут то, что если мы рассмотрим произвольные линейные (не обязательно дифференциальные) операторы, то их "произведение" (композиция, напомним) некоммутативна, и L∘M ≠ M∘L в общем случае, так что и символы совершенно не обязаны совпадать. Но если мы имеем дело с разложениями по степеням одного и того же оператора D, со всеми его закидонами, то степени оператора D (а равно и умножения на постоянные коэффициенты многочленов-символов) все коммутируют между собой так же, как коммутируют между собой степени переменной σ. Ч.Т.Д.
Ахтунг. Зачем нужны были кавычки вокруг слов "оператор" в тексте выше? Да просто пока мы не знаем, на каком линейном пространстве такой оператор действует. С точки зрения матана оператор L можно считать определённым на пространстве C∞(ℝ) бесконечно-гладких (имеющих все производные всех порядков) функций на всей числовой прямой. Но это слишком большое (бесконечномерное) пространство. На другом конце спектра возможностей находятся пространства полиномов с ограничением на степень, но в таком пространстве уравнение Lf = h может не иметь решений. Как подобрать правильное подпространство?
Что такое экспонента? Давайте начнём с простейшего случая: есть ли у оператора дифференцирования собственные векторы, решения уравнения Df =λf. Как мы знаем, на пространствах полиномов (с любым ограничением на степень) у оператора D есть только одно собственное число, нулевое, λ = 0. Легко видеть, что при λ ≠ 0 нет решений этого уравнения и в линейном (бесконечномерном) пространстве рациональных функций, дробей вида f(x)/g(x) с многочленами f и g ≠ 0. Значит, надо сознательно расширить наше пространство, добавив к нему какие-то новые элементы. Такое расширение можно сконструировать двумя способами, - аналитически и формально.
Аналитическое построение проще всего провести, добавив к рациональным функциям всего одну функцию, удовлетворяющую уравнению Df = xμ с целым показателем μ ∈ ℤ. Заметим, что при любом μ ≠ − 1, решение легко находится: f(x) = xμ+1/(μ+1). Но эта формула ломается при μ = −1, поскольку знаменатель обращается в ноль. Тем не менее матан позволяет понять, что такая функция существует: геометрически это площадь под графиком гиперболы y = 1/x между вертикалями x = 1 и x = x, определённая только для положительных иксов. Обозначим эту функцию (временно) 𝓁(x). Простое рассуждение показывает, что она монотонно возрастает, бесконечно дифференцируема на положительной полуоси и удовлетворяет там функциональному уравнению 𝓁(λx) = 𝓁(x) + 𝓁(λ). Несложно показать, что 𝓁 принимает все вещественные значения, и обратная к 𝓁 функция определена на всей числовой прямой ℝ, принимает там положительные значения и удовлетворяет дифференциальному уравнению Df = f, т.е., решает нашу задачу для собственного числа λ = 1. Эта обратная функция - ещё невиданный зверь, но и её можно изучать средствами матана, в частности, если обозначить её (тоже временно) как 𝖊(x), то она будет удовлетворять функциональному уравнению 𝖊(x + λ) = 𝖊(x)⋅𝖊(λ). Полагая в этом равенстве λ = x, мы видим, что 𝖊(n) = 𝖊(1+...+1) = (𝖊(1))n. Обозначим число 𝖊(1) буквой е (в честь Эйлера). Тогда мы сразу видим, что 𝖊(n) = en при всех натуральных n. Легко проверить, что это равенство сохраняется и при всех рациональных иксах вида x = m/n, понимать степень еm/n как корень n-й степени из икса, возведённый в степень m. А для иррациональных мы просто определим ex = 𝖊(x). Это будет очень естественное мнемоническое правило. Ах да, надо не забыть восстановить историческую справедливость и вернуть функции 𝓁(x) её настоящее имя: конечно же, это (натуральный) логарифм, 𝓁(x) = ln x.
А как же быть со всеми остальными собственными числами, спросите вы? А элементарно: по правилу производной сложной функции, D(eλx)= λ eλx. Иными словами, мы нашли все собственные векторы оператора дифференцирования в пространстве полиномов, к которому добавлены экспоненты. Это пространство бесконечномерное, и любое число λ (вещественное или комплексное) будет собственным числом оператора D.
Но на наше счастье, для каждого заданного оператора L как выше, можно ограничиться лишь конечным числом разных экспонент.
Как решить однородное уравнение? Однородное уравнение Lf = 0 можно рассматривать как задачу отыскания ядра оператора L, т.е., всех векторов, которые он убивает. Альтернативный взгляд состоит в том, чтобы найти максимальное подпространство, на котором L обращается в ноль: после ограничения на это подпространство равенство p(D) = 0 может быть понято как операторное равенство, т.е. нуль в правой части - уже не вектор, как раньше, а нулевой оператор в алгебре всех линейных операторов на этом подпространстве.
Попробуем угадать, есть ли решения уравнения Lf = 0 в пространстве экспонент? Подстановка f(x) = eλx с неизвестным пока числом λ собственным для дифференцирования D, очень проста, поскольку для такой функции Dkf = λkf при всех k = 0,1, ... , n. В результате Lf =p(λ)⋅1 = p(λ), константа. Уравнение Lf = 0 имеет ненулевое решение в виде чистой экспоненты, если и только если λ - корень многочлена p (сравните с условием обращения в нуль произвольного линейного оператора А!).
Корни известного многочлена, говорите? Мы про корни многочлена знаем всё. Давайте разложим символ оператора L на множители, как всегда, в предположении, что наше поле - алгебраически замкнутое, например, поле ℂ:
p(σ) = (σ − λ1)n1...(σ − λr)nr. Здесь λi - попарно различные корни характеристического многочлена p, ni ≥ 1 - соответствующие кратности; сумма всех корней, посчитанных с учётом кратностей, равна n. По Теореме 3, оператор L можно представить в виде произведения/композиции
L = (D − λ1E)n1 ... (D − λrE)nr.Заметим, что коммутативность позволяет нам писать эти степени в произвольном порядке, что позволяет немедленно решить уравнение полностью. В самом деле, пространство функций, на которых оператор D нильпотентен, как мы знаем - пространство многочленов степени ≤ n − 1. Немедленно проверяется, что пространство функций, на которых нильпотентен оператор D − λ - те же полиномы, умноженные на подходящую экспоненту, eλf, deg f ≤ n − 1. В частности, мы находим решения с экспонентой eλr, они образуют линейное пространство размерности nr, которые убиваются множителем (D − λrE)nr. Применение остальных множителей с этим нулём ничего поделать не может, так что мы-таки нашли сразу несколько решений исходного уравнения Lf = 0. Но теперь переставим множители в произведении так, что на последнем месте окажется любой другой множитель: та же схема сработает и с ним. В результате мы найдём ровно n линейно независимых, векторов решений нашего уравнения. Задача полностью решена.
Заметим, что если все корни характеристического полинома простые, то все множители будут линейными, первого порядка, а значит, никаких многочленов в ответе не будет, - одни только экспоненты с различными числовыми коэффициентами, f(x) = ⅀ ci eλix.
[Ахтунг: а если корни не вещественные?] Даже если характеристический многочлен оператора с вещественными коэффициентами вещественный, он вполне может иметь комплексные корни. На наше счастье, они встречаются всегда парами. Если λ = α + i ω - невещественный корень, то λь = α minus; i ω тоже будет корнем, и в вещественном решении эти две разные (при ω ≠ 0) экспоненты могут войти только с комплексно-сопряжёнными коэффициентами, что при изгнании мнимой единицы (да аллах с ней, кому она мешает?) даст две линейно независимые собственные функции eαxsin ωx и eαxcos ωx. С такими фантомами смирились даже инженеры.
Ну, написали все решения в явном виде, а дальше-то что? Придётся иметь дело с инженерами, а эти вятские - ребята хватские™. Им надо, чтобы решения уравнения были бы устойчивы, т.е., не взрывались бы, когда икс (переменная, обычно ассоциирующаяся со временем) растёт до бесконечности при x → ∞. И тут надо определиться, где лежат наши лямбды. В вещественной области экспоненциальная функция еλx быстро убывает, если λ < 0, очень быстро взрывается, если λ > 0, и ведёт себя, как мирная константа, если λ = 0. Но у нас бывают комплексные невещественные корни характеристического уравнения, и всё зависит от вещественной части λ, причём эта вещественная часть очень часто равна нулю (гармонические колебания). Вопрос устойчивости встаёт во всей своей комплексной проблематичности: если Re λ ≠ 0, то хорошо, система устойчива, а если Re λ > 0 - таки плохо.
Пограничный случай - Re λ = 0. Будет ли решение написанного выше дифура устойчиво? Ответ зависит-таки от кратности корня λ как корня характеристического уравнения. Если кратность равна единице - ничего плохого не будет, даже если корень будет невещественный. А если кратность больше единицы - жди засады. Решение y(x) = eλx ⋅ p(x) запросто может расти до бесконечности при x → +∞ даже при Re λ =0, если степень полинома p(x) больше нулевой. Соответствующие решения дифуров назывались в классической астрономии "вековыми членами": полиномиальный рост решений, конечно, гораздо медленнее, чем теоретический экспоненциальный рост, но за вековую историю астрономических наблюдений он бы накопился. Будет ли ваше конкретное дифференциальное уравнение устойчиво? считайте корни характеристического многочлена с кратностями. Будут нетривиальные кратности - ждите беды.
Резонанс Инженеры чуть другого профиля изучают то же уравнение, только с нетривиальной правой частью, функцией h(x) вместо нуля. И там начинается разное. Чтобы не плодить разномыслие, предположим, что в правую часть поставили экспоненту eμx. Вещественная, мнимая - а кто её знает, я пока в тапках математика хожу. Как решить такое неоднородное уравнение? Убей его, кричит во мне внутренний садист. Давайте применим к обеим частям дифференциальный оператор D − μ. Он убьёт правую часть, а левую превратит в однородное уравнение порядка n + 1. Добавив, как нетрудно видеть, к списку характеристических корней новое значение μ.
Чего можно ожидать в такой ситуации, с учётом сказанного выше и ещё выше? Если новое число μ не совпадёт ни с одним из предыдущих собственных чисел линейного уравнения, то ничего неожиданного не будет. Если правая часть способна в одиночку "раскачать" решения уравнения при μ > 0 - она их раскачает, и никуда не деться. Если она будет убывающей при μ < 0 - никакой беды не будет. Но если правая часть будет "малахольной" с чисто мнимой частотой, то она может повысить кратность одного из "старых" устойчивых чисто мнимых собственных значений. Была простая экспонента, порождавшая решения е± iωx b, умеренные и аккуратные - а теперь будут решения е± iωx (ax + b), которые и мост обрушить могут, если дать им волю (при а > 0). Называется это явление резонанс. Когда такое произойти может в случае уравнений с вещественными коэффициентами? когда у исходного уравнения уже была ровно одна чисто мнимая пара собственных чисел λ = ±iω. Будучи простыми, эти корни дадут устойчивые синусы/косинусы sin ωx, cos ωx в качестве решений. Но если оператор, убивший правую часть, добавит именно такую пару к списку собственных значений, создав тем самым нетривиальную кратность ≥ 2, то среди решений появятся (сравнительно медленно, но) растущие на бесконечности x sin ωx и x cos ωx. Не понимаете? Примените к неоднородному уравнению с правой частью Lf = sin ωx оператор второго порядка D2 + ω2E. Заметим, что наличие двух чисто мнимых пар с разными частотами ω ≠ ω' никакой угрозы для устойчивости не представляет.
Астрономия В астрономии (и механике), которая была основным источником задач для математиков в 17-19 веках, уравнения движения имеют несколько специальный вид, связанный с законом сохранения энергии. В простейших ситуациях они, конечно, тоже сводятся к линейным системам дифференциальных уравнений (или, что практически то же самое, к линейным уравнениям высокого порядка), но оказывается, что решения соответствующих уравнений не имеют вековых членов. Иными словами, структура таких уравнений не допускает появления нетривиальных жордановых клеток, даже если какие-то собственные значения совпадают друг с другом (сил нет рассказывать всё в деталях).
Сказанное не значит, что в астрономии и небесной механике нет понятия резонанса. Есть, да ещё какой, но это уже сугубо нелинейный эффект: оказывается, скажем, что если периоды обращения двух планет вокруг Солнца достаточно близки к рациональному числу с небольшими числителем и знаменателем, то в такой системе возможны самые экзотические варианты для, скажем, поведения метеоритов (или других планет), которые медленно, но выбрасывают их за пределы солнечной системы.
Математическая теория таких нелинейных дифференциальных уравнений называется КАМ-теорией по инициалам трёх великих математиков, понявших всю замысловатость мира в этой области: А. Н. Колмогорова, В. И. Арнольда (его ученика) и Jurgen Kurt Moser'a. Я до сих пор не могу прийти в себя, осознавая, что был хорошо знаком со всеми тремя (с АНК - к сожалению, только односторонне, он нам читал лекции, в отличие от ВИА и JKM).
Список литературы Изложение в этой последней части лекции про линейную алгебру основано на статейке, которую мне заказали в бразильском студенческом математическом журнале по итогам непечатного текста, который лежал некоторое время у меня на сайте. Желающие получить ссылку на более формально-математический текст, are welcome написать мне "в личку" или по емайлу xaxxam@gmail.com (в последнем случае с указанием, как вас зовут в ЖЖ, чтоб избежать нашествия гыгыкающих боброхуев). Не забудьте написать, куда слать файл, если вам файл приятнее. Обещаю выслать ссылку и/или файл.