Пишу уже второму клиенту "Рекомендации по стратегии развития XXX" и понимаю, что важнейший в этих рекомендациях пункт будет недооценен и поэтому имеет все шансы быть не выполненным. Речь идёт об использовании глубоких нейронных сетей. Где? Ответ: везде. Как? Ответ: очень по-разному
(
Read more... )
1. количество доступного материала недостаточно
2. в доступном материале содержатся ошибки, которые может распознать не каждый эксперт.
То есть, всё то же самое, что и с онтологиями: Пока мы в мире тривиальных примеров, всё прекрасно. Как только нужно копать что-то серьёзное, выясняется, что дефицит во времени крутых спецов и никакой студент с модными тулами их не заменит.
Reply
Reply
Я дам вам миллиард картинок (триллиона увы у меня нет), но вы не научите систему распознавать миллион классов объектов с точностью выше 96%.
Аналогично, я вам дам миллиард примеров предложений, а вы не научитесь с точностью 99% выделять объекты из этих примеров.
Пусть даже примеры будут без ошибок.
Но, увы, есть проблемы гораздо более фундаментальные, чем недостаточное количество примеров.
Reply
Откуда "я могу дать" миллиард картинок хотя бы с правильными тегами?
Reply
Reply
"мамой клянусь!"
Предложенный способ как-бы не очень годится в практическом случае.
Для реальных задач количество вариантов обозримо. И скорость обучения на разных наборах данных будет различна. То есть, теоретически задача решалась бы, если бы было достаточное количество примеров.
Reply
Reply
А собака в большинстве практических случаев и требуется. Нужно не вести философские беседы, а лаять, кусать или вилять хвостом. Теоретически даже мощностей на такое хватило бы.
Но есть публичные данные, которые мало смысла в практическом плане имеют, и есть технические данные, на которые хотелось бы напустить алгоритмы, да только смысла нет.
Reply
Leave a comment