πŸ§ πŸ’» Π’Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° Π² языковых модСлях: ΠΎΡ‚ Ρ„ΠΈΠ·ΠΈΠΊΠΈ ΠΊ ИИ

Oct 02, 2024 22:27


БСгодня ΠΌΡ‹ погрузимся Π² Π·Π°Ρ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ ΠΌΠΈΡ€ языковых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (LLM) ΠΈ разбСрСмся, ΠΊΠ°ΠΊ концСпция ΠΈΠ· статистичСской Ρ„ΠΈΠ·ΠΈΠΊΠΈ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ Π½Π°ΠΌ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΈ Π½Π°ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΈΡ… Ρ€Π°Π±ΠΎΡ‚Ρƒ. Π Π΅Ρ‡ΡŒ ΠΏΠΎΠΉΠ΄Π΅Ρ‚ ΠΎ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ ΠΈ Π΅Π΅ связи с распрСдСлСниСм Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π°.πŸš€

🌑️ Π§Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° Π² LLM?

Π’ контСкстС языковых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° - это Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ влияСт Π½Π° Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ ΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ тСкста. ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ это Ρ€ΡƒΡ‡ΠΊΠ° настройки "крСативности" ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° (ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡ΠΈΠΌ Π΅Π΅ ΠΊΠ°ΠΊ T) примСняСтся ΠΊ Π»ΠΎΠ³ΠΈΡ‚Π°ΠΌ ΠΌΠΎΠ΄Π΅Π»ΠΈ (Π½Π΅ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹ΠΌ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ значСниям) ΠΏΠ΅Ρ€Π΅Π΄ ΠΈΡ… ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Π² вСроятности:

p_i = exp(z_i / T) / Ξ£_j exp(z_j / T)

Π³Π΄Π΅ p_i - Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π²Ρ‹Π±ΠΎΡ€Π° i-Π³ΠΎ Ρ‚ΠΎΠΊΠ΅Π½Π°, z_i - ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ Π»ΠΎΠ³ΠΈΡ‚.

πŸ”₯ Π­Ρ„Ρ„Π΅ΠΊΡ‚ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹

  • ΠŸΡ€ΠΈ Π½ΠΈΠ·ΠΊΠΎΠΉ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ (T β†’ 0) модСль становится Π±ΠΎΠ»Π΅Π΅ "ΡƒΠ²Π΅Ρ€Π΅Π½Π½ΠΎΠΉ" ΠΈ консСрвативной, выбирая Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ вСроятныС Ρ‚ΠΎΠΊΠ΅Π½Ρ‹.
  • ΠŸΡ€ΠΈ высокой Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ (T β†’ ∞) модСль становится Π±ΠΎΠ»Π΅Π΅ "ΠΊΡ€Π΅Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ" ΠΈ нСпрСдсказуСмой, давая шанс ΠΌΠ΅Π½Π΅Π΅ вСроятным Ρ‚ΠΎΠΊΠ΅Π½Π°ΠΌ.
πŸ›οΈ Бвязь с Ρ„ΠΈΠ·ΠΈΠΊΠΎΠΉ: распрСдСлСниС Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π°

Π’Π΅ΠΏΠ΅Ρ€ΡŒ самоС интСрСсноС! ΠžΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ΡΡ, Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° Π²Ρ‹Π±ΠΎΡ€Π° Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π² LLM ΠΈΠΌΠ΅Π΅Ρ‚ Π³Π»ΡƒΠ±ΠΎΠΊΡƒΡŽ связь с распрСдСлСниСм Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π° ΠΈΠ· статистичСской Ρ„ΠΈΠ·ΠΈΠΊΠΈ. Π”Π°Π²Π°ΠΉΡ‚Π΅ разбСрСмся!

РаспрСдСлСниС Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π° описываСт Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ нахоТдСния частицы Π² ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌ энСргСтичСском состоянии ΠΏΡ€ΠΈ Π·Π°Π΄Π°Π½Π½ΠΎΠΉ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π΅:

p_i = (1/Z) * exp(-E_i / (k_B * T))

Π³Π΄Π΅:

  • p_i - Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ состояния i
  • E_i - энСргия этого состояния
  • k_B - постоянная Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π°
  • T - Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π°
  • Z - статистичСская сумма (Π½ΠΎΡ€ΠΌΠ°Π»ΠΈΠ·ΡƒΡŽΡ‰ΠΈΠΉ ΠΌΠ½ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒ)

πŸ”— ΠŸΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠΌ Π°Π½Π°Π»ΠΎΠ³ΠΈΠΈ

  1. ЭнСргия E_i Π² Ρ„ΠΈΠ·ΠΈΠΊΠ΅ соотвСтствуСт ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ Π»ΠΎΠ³ΠΈΡ‚Π° (-z_i) для Ρ‚ΠΎΠΊΠ΅Π½Π° Π² LLM.
  2. Π’Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° T ΠΈΠ³Ρ€Π°Π΅Ρ‚ Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΡƒΡŽ Ρ€ΠΎΠ»ΡŒ Π² ΠΎΠ±ΠΎΠΈΡ… случаях.
  3. ΠŸΠΎΡΡ‚ΠΎΡΠ½Π½ΡƒΡŽ Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π° k_B ΠΌΡ‹ опускаСм Π² LLM, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ½Π° лишь ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Ρƒ.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° Π²Ρ‹Π±ΠΎΡ€Π° Ρ‚ΠΎΠΊΠ΅Π½Π° Π² LLM ΠΏΠΎ сути эквивалСнтна Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ Π‘ΠΎΠ»ΡŒΡ†ΠΌΠ°Π½Π°!

πŸ§ͺ ЀизичСская интСрпрСтация Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ тСкста

Π­Ρ‚Π° аналогия позволяСт Π½Π°ΠΌ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ процСсс Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ тСкста ΠΊΠ°ΠΊ Ρ‚Π΅Ρ€ΠΌΠΎΠ΄ΠΈΠ½Π°ΠΌΠΈΡ‡Π΅ΡΠΊΡƒΡŽ систСму:

  • Высокая Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° = "Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½Π½ΠΎΠ΅" состояниС систСмы с высокой энтропиСй β†’ Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹ΠΉ ΠΈ ΠΊΡ€Π΅Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ тСкст.
  • Низкая Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π° = систСма стрСмится ΠΊ ΡΠΎΡΡ‚ΠΎΡΠ½ΠΈΡŽ с минимальной энСргиСй β†’ прСдсказуСмый ΠΈ "бСзопасный" тСкст.
πŸš€ ΠŸΠΎΡ‡Π΅ΠΌΡƒ это Π²Π°ΠΆΠ½ΠΎ?

  1. Π­Ρ‚Π° аналогия Π΄Π°Π΅Ρ‚ Π½Π°ΠΌ Π±ΠΎΠ»Π΅Π΅ Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ LLM.
  2. Β ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ статистичСской Ρ„ΠΈΠ·ΠΈΠΊΠΈ для Π°Π½Π°Π»ΠΈΠ·Π° ΠΈ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ языковых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.
  3. Зная эту связь, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π±ΠΎΠ»Π΅Π΅ осознанно ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΊ Π²Ρ‹Π±ΠΎΡ€Ρƒ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹ для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡.
πŸ’‘ Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π£Π΄ΠΈΠ²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΊΠ°ΠΊ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΈ ΠΈΠ·, казалось Π±Ρ‹, Π΄Π°Π»Π΅ΠΊΠΈΡ… областСй Π½Π°ΡƒΠΊΠΈ, ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠ΅Ρ€Π΅ΠΏΠ»Π΅Ρ‚Π°Ρ‚ΡŒΡΡ ΠΈ Π΄Π°Π²Π°Ρ‚ΡŒ Π½Π°ΠΌ Π½ΠΎΠ²Ρ‹Π΅ инструмСнты для понимания ΠΈ управлСния слоТными систСмами, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ языковыС ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π­Ρ‚ΠΎ Π΅Ρ‰Π΅ Ρ€Π°Π· ΠΏΠΎΠ΄Ρ‡Π΅Ρ€ΠΊΠΈΠ²Π°Π΅Ρ‚ Π²Π°ΠΆΠ½ΠΎΡΡ‚ΡŒ мСТдисциплинарного ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° Π² соврСмСнной Π½Π°ΡƒΠΊΠ΅ ΠΈ тСхнологиях.

Всё это ΠΈ ΠΌΠ½ΠΎΠ³ΠΎ Π΄Ρ€ΡƒΠ³ΠΎΠ΅ - Π’Π“ "ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠ° Π½Π΅ для всСх".

Previous post Next post
Up