>> И вот у меня есть хороший программистский бэкграунд, чтобы с этим справляться, но что советовать людям, у которых опыта меньше - как-то пока непонятно совсем. Есть идеи?
Лучшая, на мой взгляд, прямо вытекает из всего текста - говорить таким людям: "Я умею решать такие проблемы, обращайтесь за решением Ваших проблем ко мне".
Сейчас-то уже говорят о том, что подготовка датасета ~70% времени от решения всей задачи, только это действительно превращает задачу в скучную рутину с SQL, ad-hoc скриптами и геморроем. Потенциально проблему могут решать инструменты автоматизированного контроля качества данных, но и там правила нужно настраивать под определенные модели данных.
Если говорить о перспективах то я вижу решением проблемы использовать conditional function dependencies и их автоматический вывод по всему датасету. После этого делить датасет на несколько множеств какой-нибудь классификацией и пытаться вывести правила очистки исходя из того, какое множество мы считаем корректным. Другое дело, что в этой области поле непаханное и прорывов мало - скучно же.
1. Описывать бэкграунд через статьи/презентации. Т.е. не столько сам результат, сколько процесс его достижения. 2. Подкреплять его историями. Истории/байки дают более крепкие и устойчивые ассоциации, контент запоминается лучше. Вот, например, "2% слов перекрывают 70% диалогов" - это легко запоминается.
Comments 16
Лучшая, на мой взгляд, прямо вытекает из всего текста - говорить таким людям: "Я умею решать такие проблемы, обращайтесь за решением Ваших проблем ко мне".
Reply
или просто передача опыта, которая часто сильно нужна передающему
Reply
Reply
Вижу что-то общее с унивалентностью %)
Reply
Reply
Если говорить о перспективах то я вижу решением проблемы использовать conditional function dependencies и их автоматический вывод по всему датасету. После этого делить датасет на несколько множеств какой-нибудь классификацией и пытаться вывести правила очистки исходя из того, какое множество мы считаем корректным. Другое дело, что в этой области поле непаханное и прорывов мало - скучно же.
Reply
Reply
Reply
Reply
2. Подкреплять его историями. Истории/байки дают более крепкие и устойчивые ассоциации, контент запоминается лучше. Вот, например, "2% слов перекрывают 70% диалогов" - это легко запоминается.
Reply
Leave a comment