ИИ для Иа-2 или задача трехдневного оливье

Jan 03, 2025 09:51


Я вам такую давеча обещала)

Потому, что насчет цифрового раба МарьСанна вовсе не шутила, именно для этого проекта он ей и нужен, чтобы решить пару задач.

Конечно, вы скажете, где цифровые технологии и где - МарьСанна, если речь не идет об онлайн-шоппинге.
Но нет, граждане, когда МарьСанне прямо-таки надо, она умеет отклеивать нос от потолка и учится у лучших.
Она уже некоторое время следит за тем, что и как понимающие по сабжу люди делают в этом направлении и как превращают цифровых болванов в послушных и обученных для разных химических задач, она прослушала энное количество лекций и докладов (не в смысле, где ее в это время черти носили, а внимательно!), прочитала энное количество статей и даже посоветовалась прицельно с уважаемым коллегой, который уже обучил собственного цифрового раба как раз для различения рамановских спектров.

И поэтому она уже вроде бы примерно представляет себе, как решать задачу номер 1 - использовать ИИ для поиска соединений, потенциально подходящих для одноэлектронного окисления и SERS анализа на наших чипах, из опубликованных статей и баз данных.
Но эта задача не требует обучения нейросетки на обширном новом экспериментальном материале, он уже собран и опубликован другими людьми. Требует только программистов и вычислительных мощностей. (МарьСанна окидывает взглядом окружающую среду. Среда съеживается, программисты прикидываются курьерами, мощности прячутся в третий пентиум).

А вот над задачей номер 2 МарьСанна ломает голову до сих пор и почти что уже ее и доломала (благо не такое это и трудное дело), но надежного решения так и не нашла.


Суть задачи. КР-спектросокпия - так себе метод для определения и различения белков, например, человеческий и бычий альбумины он не отличает. Точнее, до сих пор был таким, но наш подход за счет селективного окисления определенных связей может это изменить. Важно это для тех белков, что токсичны в низких концентрациях. Да, да, вы правильно киваете в сторону фасоли, шпрот и прочих продуктов питания, и стыдливо задвигаете трехдневные шубу и оливье в дальний угол холодильника. В продуктах при недолжном обращении/хранении заводятся клостридии, а вместе с ними - ботулин. МарьСанна решила не дожидаться милостей Роспотребнадзора, чтобы он позакрывал еще эн ее любимых сервисов доставки еды, и взять дело спасения оных в свои руки.
И хочет научить нейросетку на собственной экспериментальной выборке опознавать КР спектры ботулина в любых, даже прежде не тестированных продуктах питания без длительной пробоподготовки (какая-то будет, но не архисложная).
Чтобы в каждом холодильнике установить рамановский спектрометр, который бы ласковым голосом МарьСанны покрикивал в случае опасносте "А ну-ка немедленно положи это в мусорное ведро, неразборчивая ты скотина!" "Этот продукт представляет опасность для вашего здоровья и не пригоден для употребления в пищу!". А кто не установит, тому отключим газ. И свет.

Проблема состоит в том, что чистый ботулин для обучения ИИ невозможно достать. К нему, во-первых, всегда приаттачен гем-агглютинин - вот так эта хитрая протеиновая дрянь поражает человеческие ткани, примерно как вирус гриппа, видимо, где-то там какой-то вирусно-бактериальный промискуитет случился на задворках эволюции. Но это ладно, пусть живет, если они с ботулином всегда вместе. Но во-вторых, в любых препаратах ботулотоксина, которые вы можете достать/купить, в качестве стабилизаторов или сахара (разные), или те самые альбумины.

Да, можно тщательно вычесть вручную с помощью хорошего спектроскописта спектр чистого альбумина из такого составного. Но - химическая реакция такая штука, что она зависит от условий, и окисление что ботулина, что альбумина в смеси совершенно не обязательно будет протекать так, окисление ботулина отдельно или в смеси с чем-то другим.

А отсюда следует, что я могу внести неустраняемую ошибку уже на начальном этапе при обучении.
И в какой-то момент она может выстрелить в совершенно невиновного производителя/ресторатора/продавца, правдоподобно показав то, чего в действительности в продукте питания нет. Последствия отсюда могут проистекать сообразные - изъятие продукции, закрытие предприятия, лишившиеся работы и денег люди, в общем, на это МарьСанна под флагом науки подписываться не будет.

Мне не надо правдоподобно, надо точно. ВотЪ.
Можно ли с этим совладать и как - пока не понимаю.

По уже сложившейся традиции поиска соавторов в ЖЖэшечке - те, кто понимает в цифровых технологиях лучше, чем МарьСанна в онлайн-шоппинге, и кому кажется интересной эта задача, - велком по красной дорожке, буду исключительно признательна. Вы не смотрите все эти таблички на МарьСанне "огнеопасно", "не наклонять" и прочая, обычно, если МарьСанне самой от кого-то что-то надо, она с людьми ведет себя очень примерно)
Можно в личку или в комменты.

Любые идеи по сабжу и от непрофильных специалистов также приветствуются.

другая академия, real life, звуки, sciendum

Previous post Next post
Up