Язык, на котором разговаривает человек, не принадлежит этому человеку. Язык принадлежит обществу, которое снабжает им своих членов. Он создается обществом, им же поддерживается и видоизменяется. Он нужен для того, чтобы человек мог быть в обществе - одиночке язык не нужен.
Вначале всегда есть слово. Того, для чего нет слова, для нас нет. Обучая ребенка языку, мы для каждого предмета даем названия, которые он запоминает. Постепенно ребенок приучается к тому, что всё, что он видит, должно иметь названия. Всё неименованое - для нас не существует.
Что изображено на картинке?
Кот - странный кот, мертвое животное, млекопитающее
Чучело - высушенное, расправленное, таксидермия, арт
Мультикоптер - летательный аппарат малого класса, автономное питание, аэродинамика
Беспилотник - дистанционно управляемый робот, радиопередача аналогового сигнала
Ардукоптер - Atmega, AVR, PID-регуляция параметров
Слабая опасность - винты, помещение, выставка, люди в опасности
Фамилиар - какая-то хрень, жужжит, магия
Котокоптер - недостаточно описывает все входящие понятия, требует нового контекста
Мы видим, что каждое из определений истинно, но неполно.
Основная идея поста - в языке большинство определений неполно, и принципиально невозможно привести их к полноте.
Пример посложнее: ревматизм - ревматическая лихорадка - инфекционный эндокардит. Для некоторых врачей в разные периоды времени это одно и тоже: проникновение инфекции в кровь через ворота (больной зуб или гланды), ее размножение на клапанах сердца с последующим занесением кровью в суставы.
Для других эндокардит - это одно, а ревматизм - он же, но с поражением суставов.
Для третьих - ревматизм вообще может быть неинфекционным! А это совсем другое лечение.
Проблема, кстати, очень серьезная, у меня брат от этой фигни чуть не умер.
Решают ее по-разному, например делая максимально полную терминологическую базу. В одной из таких баз число терминов перевалило за триста тысяч, и это не конец. Сама база стала неприменимой на практическом уровне - с ней невозможно работать. Нужный термин может встречаться в двух десятках контекстов - а типовая история болезни обычно состоит из около сотни таких терминов. Пробежаться по двум тысячам терминов - нет уж, увольте.
Вернемся назад - я считаю, что не просто нет необходимости в создании точного языкового определения, а оно невозможно. Каждое слово - просто набор ссылок на другие понятия, причем разный у каждого человека и тем более в каждом языке. Более того, этот набор изменчив, и само познание - процесс изменения количества и качества таких ссылок.
Но тогда получается, для семантических вычислений, будь то перевод текста или работа экспертной системы, нам не нужно добиваться идеальных контекстов. Наоборот, точные контексты вредны, поскольку они, получается, потворствуют энтропийному барьеру. Всё, что нужно - это обеспечить выполнение условий, при которых каждое определение имеет достаточные границы (пределы) с другими. Т.е. иногда достаточно указать, что кокрастыке - это всё, что не брет, а брет - соответственно, не кокрастыке.
Слабые места у такой системе появятся только при ее стыковке с другими системами понятий, т.е. внутри происходит неосознание границ своей компетенции (т.е. всё нормально пока никто не придет и не спросит - а кто такой Кокрастыке?). И если это позволяет большинству людей нормально жить и работать, то почему бы не существовать семантическим контекстам, в которых внутренняя компетентность всегда считается максимальной?
Производя по ним вычисления, мы можем считать, что каждый контекст - достаточен и полон. По сути, это то же самое что поставить специалиста-человека на свое место. Для смотрителя переезда вся работа и даже жизнь укладывается в "шлагбаум закрыт - шлагбаум открыт". Для нашего контекста - в те рамки, в которые мы его помещаем, но при этом внутри их у него не может быть ситуаций некомпетентности - любое преобразование считается достаточным.
А еще, ничто не мешает делать такие контексты междуязыковыми, т.е. сопрягая внутри огранченное число понятий из двух языков и обеспечивая достаточность системы в какой-то локальной области. Как у торговцев в пограничных зонах. Мне кажется, это должно привести не к усложнению, а к упрощению контекста - в точности как те торговцы вырабатывают пиджин, эрзац-язык на основании двух и более смежных языков, более бедный и простой, чем исходные языки, но тем не менее достаточный для передачи необходимой информации и преобразуемый в валидные конструкции каждого из исходных языков.
Очевидно, полной передачи смысла тут происходить не будет, но этого и не надо! Ведь язык, как мы убедились выше, обладает принципиальной неполнотой.