яндекс и Тихонов

Oct 30, 2006 13:17

1. в пятницу были на экскурсии в яндексе. фирма на самом деле прикольная, атмосфера мне понравилась. мне не нравится то, что они делают, но нравится то, как они это делают. пообщались с ильёй сегаловичем (iseg), челом, про которого я 2 года читал в рассылках. посмотрели датацентр на вавилова/губкина, там прикольно: сервера, кондиционеры.. названия ( Read more... )

univer, math, coding, cmc

Leave a comment

anatolix November 13 2006, 13:36:52 UTC
1) Это совершенно не значит, что эти сервисы не интересно писать - у нас есть много народу которые пишут вещи которые кажутся невозможными в принипе.
2) В Gmail ничего плохого не вижу - отличная почта - мне нравится(правда я программист)(со спамобойкой только плохо). Но у народа не пошла.
3) В то время я еще не работал. Но ты ошибаешься. К тому времени как появился Яндекс Рамблер уже во всю был, и считается яндекс сделал его предоставив большое количество дополнительных сервисов. Опять же ты наверное слышал, что iseg говорил про снипетты(его мнение что Гугль всех на западе сделал, а мы здесь потому как у других поисковых систем до 2003 года вообще не было сниппетов)
5) Ну вот смотри - ищу в nigma anatolix
http://nigma.ru/index.php?q=anatolix&0=1&1=1&2=1&3=1&4=1&5=1&6=1&7=1
Первые кластеры profile, http anatolix, people вообще не про то. Java free books чуть-чуть. Форум куда ни щло. alexmoskalyuk вообще не про то. Все кластеры получены категоризацией навигации и всякого мусора.
Ну не может ни Яндекс ни гугль себе позволить такое гавно на выдаче поставить - как только технологии дорастут что ответы будут релевантными тогда и подумаем. (BTW ты в курсе что у Нигмы нет своего поиска - у нас с ними договор, а у Гугла они выдачу так попросту воруют)
По поводу движка Яндекса и Гугла - в рунете мы ищем лучше. Я серьезно - мы это меряем.
6) Сайты оптимизируют под те системы которые дают больше трафика, а не у которых PR стабильней. По дорвеям почитай SEO форумы начиная с августа, сейчас у нас дорвеев сильно меньше чем в гугле.

Reply

semifinalist November 17 2006, 10:38:36 UTC
1) ну, бубен есть у всех. какая фирма обойдётся без шаманов?

2) нормальный почтовый клиент будет фильтровать спам сам. откуда сервер знает, что есть спам для меня?

3) я, конечно, не специалист, но, думаю, сниппеты написать не так трудно. но разговор ведь не об этом, а о расходах на пиар.

5) ну, какая-никакая кластеризация всё-же есть и по этому запросу. только я не пойму: (1) зачем нужно искать свой ник через поисковик и (2) какую кластеризацию вы ожидаете? Недавний пример. Есть такая не очень раскрученная в москве муз.группа Саранча. Без кластеризации довольно трудно придумать запрос, который даст ссылки на сайты группы, а не на ленты про очередное нашествие насекомых.
У нигмы есть _свой_ поиск, это, кажется, обсуждалось: http://nigma.ru/index.php?q=&7=1
И потом: как вы можете говорить о том, что нигма что-то ворует? Выдача гугла - это его собственность? или он запрещает использовать его невручную? А то, что у вас договор.. Мои небольшие познания в бизнес-этике подсказывают, что так вот обсирать своих компаньонов всё ж не стоит. Хотя Вам, конечно, виднее.
Насчёт того, что яндекс в рунете лучше.. ну да, раньше они забивали на рунет. гугл не умеет разбирать русскую грамматику, но вродь они щас собираются аутсорсить в Питере, сделать там офис на 3к сотрудников, думаю, и до этого дело дойдёт.

7) яндекс существует 8 лет. почему я должен судить по форумам за последние 3 месяца?

Reply

esyr November 18 2006, 08:04:06 UTC
2. Элементарно, основываясь на массовости рассылки. То, что пришло десятку тысяч пользователей Яндекс.Почты, вряд ли нужно хотя бы одному из них. Да есть рассылки, но это уже исключение. Которое создаёт пользователь, и рассылка больше в спам+рассылки не попадает.

5. Гугл запрещает пользоваться своей выдачей, считает её своей собственностью и очень сильно палит метапоисковики. Это известный факт.

Reply

anatolix November 21 2006, 17:29:20 UTC
2) Во первых у нормального почтового клиента нет такой базы IP адресов как у нас
http://company.yandex.ru/blog/?msg=70&month=5&year=2005
90% спама мы убиваем по IP отсылающего, этот способ гуманней т.к. при false positive ты получишь отбой от сервера, а не письмо просто не дойдет. А во вторых от этого нельзя спастись закатав весь текст в картинку например.

Аргумент про то, что сервер не сможет правильно отрезать спам потому как не знает, что конкретно для тебя спам не выдерживает критики. Я думаю если я сейчас перешлю все 500 писем из моей папки "спам" тебе, у нас не будет ни одного расхождения в оценке.

5) А зачем вообще нужно искать что-нибудь через поисковик? (Вообще конкретный ответ потому как я хорошо знаю выдачу поисковиков по этому слову, но твой вопрос это совершенно не аргумент для оправдания плохой кластеризации). Что я хочу видеть это вопрос достойный обсуждения, но вот что я точно не хочу видеть так это мусор.

Да конечно же выдача Гугла это его собственность - и да он запрещает использовать ее не вручную:
http://www.google.ru/intl/ru/terms_of_service.html см. пункт "Автоматические запросы запрещены"

По слову "саранча", кстати тоже полно мусора.

Договор не запрещаем мне выраждать мое личное мнение - я свободный человек - кроме того выражение общеизвестных фактов(которые ты например и так знал) наверняка стоит считать обсиранием - это критика.

В питере в офисе гугла сейчас в 300 раз меньше сотрудников чем ты читал в прессе(10 человек), во всем гугле по всему миру 5000 человек, а во всем питере нет 3000 программистов уровня Гугла. И вообще не стоит верить всему что пишут журналисты которые совершенно не в теме. Гугл умеет разбирать русскую грамматику с октября 2005 года.

7) Потому что ты пишешь в настоящем времени, если хочешь писать за прошлые 8 лет пиши в прошедшем.

Reply

semifinalist December 8 2006, 10:21:42 UTC
ладно, я думаю, не имеет смысла продолжать этот глупый спор, ибо каждый из нас всё-равно останется при своём мнении.
я не пытаюсь доказать, что нигма является абсолютной панацеей, а всего лишь хочу обратить внимание на важность наукоёмких разработок в предметной области.

Reply

anatolix December 11 2006, 09:18:21 UTC
Вот это уже другое дело :) Я тоже хочу обратить твое внимание на важность наукоемких разработок в предметной области.

Просто не нужно считать, что если у нас нет желания, поставить невозможную для использования хрень, в большой поиск, то мы это вообще не пишем и не смотрим. Наверное fact extraction, и последующая сборка его в "пресс портреты", который у нас сделан на новостях, в 100 раз примерно круче чем все что есть у Нигмы. Но почему то ты про это не пишешь. Плохо PR-имся?

Reply

semifinalist December 14 2006, 13:01:26 UTC
вы пиарите больше бренд, но не конкретные возможности. например, у меня нет времени лазить по порталу и смотреть, какие там возможности, поэтому я видимо и не знал о возможностях. кста, речь об этом, что ли?: http://opinion.news.yandex.ru/

Reply

anatolix December 18 2006, 19:23:22 UTC
И об этом тоже, но в основном о профилях людей и их должностях
http://news.yandex.ru/people/khristos_iisus.html
Просто автогенеренное досье. Все факты достаны из обычного текста.

К сожалению PR должен задевать людей, а среднестатистический пользователь не способено понять крутость fact extraction - с его точки зрения наши новости ничем не лучше чем лента.ру на которой такие же досье собраны руками.

Ты в этом смысле что называется "не репрезентативен" (c). У нас даже майки есть с надписью "Я нерепрезентативен".

Reply

semifinalist December 21 2006, 07:10:35 UTC
спасибо, поигрался)
забавная штука

Reply

anatolix December 21 2006, 11:45:51 UTC
Эта штука она в реализации сильно сложнее чем nigma
(кстати nigma Ашманов вообще считает просто проектом на котором PR-ится лавренко, чтобы получить деньги под что-нибудь коммерческое
см http://www.habrahabr.ru/blog/equityguide/2168.html#comment21745
).

То что у новостей все-таки достаточно чистый текст без явного мусора и целенапаравленного спама позволяет прямо сейчас получать результаты. Для того чтобы весь web так помайнить дело еще долго не дойдет.

А таких поделок как в nigma если честно здесь внутри полно.

Reply

semifinalist December 28 2006, 12:51:14 UTC
спасибо за ссылку)
вроде умные люди, а такие споры..

Reply

anatolix December 28 2006, 23:15:23 UTC
Кстати Лева читал по ней доклад на Jug - если хочешь вот презентация
http://www.jug.ru/servlets/images/meeting_2006_12_23/FactExTech.ppt
Там тезисы, но представление про то как это устроено получить можно.

Reply


Leave a comment

Up