За свой двадцать третий год я переехал в Цюрих и перевидал столько новых и интересных для себя вещей, что и не упомнить. Вот самые интересные:
- Сделали с Кириллом snya.li - индексируем предложения о сдаче квартир с ВКонтакте. Число посетителей невелико, но медленно растет само собой, и набирается довольно аппетитная статистика по кликам :) Скоро буду смотреть. Еще нужно бы воспользоваться моментом перед началом семестра и написать в какие-нибудь старт-аперские места, реклама сама, видимо, не купится. С точки зрения технологий может выйти крутая шутка - если вдруг денег дадут :)
- Сделали проект по СтатсЛабу. Нам принесли данные обследований пациентов с повреждениями позвоночника и попросили найти самый эффективный способ их сжать до нескольких цифр, чтобы докторам было удобнее на них смотреть. Сделать то мы сделали - презентация, понятный отчет, полный отчет, код - было интересно и полезно научиться нормально писать на R. Но, если по чесноку, данные нужно докторам представлять не в качестве цифр, а в качестве рисунков. Я упомянул это в разговоре с врачами, и им понравилось - попросили написать которкую статью о проекте, на самом деле - предложить способ. Посмотрим, что выйдет, может им понравится моя идея.
- Думал по поводу статистического консалтинга. Очень странные сейчас средства по анализу данных, если честно. Весь код пишется в одном файлике Analysis.R, выводы и субъективные суждения не регистрируются, а результаты записываются в отчет часто без всякого обоснования. Вот если бы придумать такой git (скорее даже не git, a changes tracking), чтобы куски кода для получения статистик/графиков перемежались с аннотациями человека, на это смотрящего и делающего выводы о том, куда смотреть дальше. Тогда можно было бы восстанавливать и воспроизводить всю логику проекта начиная с данных. Я что-то такое предложил на семинаре, мне сказали, что если одному данные анализировать, все и в голове помещается. Нужно бы поинтересоваться, где люди в командах данные анализируют.
- Устроился на работу в Институт Компьютерной Лингвистики - очень классные ребята. У них есть тысячи био-медицинских статей на разных языках, размеченные аннотациями из domain-specific онтологии. Почти все время до этого я прогал на питоне и баше тулзы для alignment'a, а теперь буду пробовать реализовать crowdsourcing-платформу для решения разных задач типа устранения неоднозначности аннотаций. Не совсем мой любимый ontology engineering, но близко, буду стараться двигаться в этом направлении.
- Написал несколько русскоязычных текстов - мало, но почти все мне нравятся. Кроме здешних помню только комментарии к посту Кати Казбек - я там про творческую и техническую интеллигенцию и разницу подходов к моральным вопросам. Надо бы скопировать в ЖЖ, потеряется ведь.
- Прочел Zen and the Art of Motorcycle Maintainance. Предлагаемая автором монистическая философия мне очень понравилась, так он здорово разрешил "конфликт" стремлений к красоте и технологическому прогрессу. Самая запомнившаяся часть книги - рассказ про "застревание" в процессе решения технической задачи. Ведь застревание на самом деле - самое креативное время - когда действительно непонятно, что делать дальше, и нужно это как-то придумать, непонятно как. Это - самый творческий момент.
- Понял, что так и не обнаружил никакого культурного или языкового барьера в общении по-английски. Шутки потихоньку шутятся, намеки понимаются, всем все ясно. Чем дальше, тем лучше.
В общем, сконцентрироваться на чем-то одном (например, учебе) не удалось, и я не сильно расстраиваюсь по этому поводу :) Мой файлик main.org предлагает в дальшейшем думать, в добавок к вышеописанному, в сторону:
- Анализа данных из snya.li. Есть несколько неплохих, как мне кажется, идей.
- Gamification of crowdsourcing tasks (глупо как-то переводить было). Мой нынешний прототип платформы исполнен в духе времени (толстый клиент на JS + REST API) - воткнуть визуализации заместо вопросов в нужный момент будет просто.
- Causal graphs как инструмент в статистическом консалтинге.
И стараться писать почаще, полезное это дело.