Диалектический прагматизм. Онтология. Данные

Dec 31, 2011 08:26



5.Данные

Статистика ведётся с января 2009 года по данным сайта 72doma.ru, и сначала пару слов, почему выбрал именно 72doma:
  1. В «Живой Тюмени» на 72.РУ у меня аккаунт и, соответственно, просто автоматически попал на 72doma, элементарно находясь внутри общего портала, прежде чем выбрал другой, а потом… ну не уходить же, пока итак всё в порядке!?
  2. По большому счёту было всё равно и, следовательно, он вполне подходил, а база в десятки тысяч объявлений - вполне приличная, тем более, когда не точная ценовая статистика интересует, а векторная, относительная, рассчитываемая для определения тренда и прогноза его движения. А публикуемая на сайте у его прямого конкурента (портала dom72.ru) «Статистика цен», меня лично, полностью устраивает, чтоб ещё тратить собственное время на её перепроверку.
  3. Он казался менее профессиональным, чем, к примеру, тот же dom72 (nashgorod.ru), а напротив, более частным. То есть, для случайных и не подверженных влиянию и намеренному искажению выборок, статистически более значимым. Да ещё выглядел элементарно удобнее структурированным, чтобы просто списывать цифры.


Сначала наблюдал только общие значения в разрезе «Всего», «Жилая» и «Нежилая». С 1 сентября 2009 года добавил публикуемые счётчики по всем подразделам базы объявлений. Отмечу, что по ним ежедневных обновлений/добавлений счётчик не показывал. Заметив расхождение в показания счётчиков с фактическими данными (когда входишь непосредственно в раздел объявлений), начал с 1 января 2010 года дополнительно выбирать и их тоже. Тогда уж заодно самостоятельно считать количество добавлений/обновлений за последние сутки. С  24 марта 2010 года на 72doma поменялась вся структура базы данных, и пришлось примериваться заново. Неделю, пока разбирался, пропустил регистрацию обновлений. Потом стал снова наблюдать всё, для начала в режиме непосредственного самостоятельного подсчёта в каждом подразделе. С 30 мая 2010 снова добавил информацию со счётчиков, тем более выяснилось, что там отныне в виде «за последние сутки» публикуется количество только действительно новых, вновь появившихся объявлений. С этой же даты стал регистрировать данные с dom72.

На это подвигла кислая физиономия директора РАН «Этажи» Ильдара Борисовича Хусаинова, когда он скривился, узнав, что беру данные только с одного сайта. Немного поборовшись с собственным упрямством и самомнением (и, к счастью, поборов их), плюнул, решив что он прав, и следует собирать максимально много из сколь возможно обширных источников. Однако там тоже не сразу разобрался. Сперва думал, что устанавливаемый флажок на «Новостройки» выбирает их из общей базы и показалось сложным высчитывать (думал сперва, что раз с Дом72 данные всё равно лишь вспомогательные будут, то и так сойдёт). Но потом как-то заметил, что совершенно другие объявления вываливает поисковик. То есть, чтобы общее количество найти, необходимо найти и «Новостройки» тоже, добавив их к разделу «Вся недвижимость». Добавил их с 12 ноября 2010 года. Однако ленился высчитывать с сайта размер ежедневных обновлений. А на Дом72 и считать-то труднее визуально, чем на 72Дома. Любознательность одержала верх над леностью к 12 февраля 2011 года. Вот с этой даты статистика ведётся по всем разделам и подразделам баз данных обоих крупнейших Тюменских сайтов.

Правда, из-за этого пришлось чередовать их, один день с одного, а второй с другого. Сбор информации с одного сайта занимает порядка 2 часов, и тратить ежедневно по полдня на оба, не мог себе позволить. Но, поскольку я их свожу в единую базу, то они день ото дня компенсируют друг друга, и пробелов в едином числовом ряду нет. Вообще же, пробелы бывали, и ещё не раз будут. Не наблюдаю рынок, когда болею сильно, когда компьютер выходит из строя, интернет отключается, электричество, и по иным похожим причинам. Был даже промежуток в 8 дней, что прервало на графике недельную скользящую среднюю. К счастью пробел незначительный и пока единственный. Это мелкий недочёт.

Важнее вопрос, почему именно объявления считаю, а диаграммы называю при этом и в тексте постоянно проговариваюсь, как «объём сделок» таких-то и сяких-то? Действительно, нельзя уверенно сказать, что где больше объявлений, там и сделок больше. Но такое предположение много разумней, чем обратное, что где меньше объявлений, там сделок всё равно больше. В широком плане слово сделка обозначает не только фактический переход прав или их некоторого объёма, но и подготовку к такому переходу. Думаю, все слышали выражения, типа: «закрыли сделку» - а что тогда было до закрытия? Или же: «начали переговоры по сделке» - почему, отчего вдруг начали, откуда взяли информацию, что один готов продать, а другой купить? Прямо сопоставлять количество объявлений сделкам не корректно, но за неимением иного допустимо (мне так кажется). Кто продаёт, тот в итоге всё равно продаст, а кто хочет снять, в конце концов, найдёт и арендодателя. Сделка в строгом смысле это обменная операция, а объявление это её начало, именно с таким допуском и считаю их.

Почти вся терминология и определения взяты из «Википедии». Большая часть пояснений и описательных статей оттуда же (элементарно, чтоб единый источник был). Львиная доля материалов и книг, которые формировали мои принципы, также просто из интернета. Ссылки не привожу, но найти их легко. Кто не в курсе, так работая с поисковыми ботами, следует просто вносить запрос в максимально полном и точном виде. Для примера, возьмите любое рубаи Омара Хайяма и введите его в строку целиком. Уверяю, Google, да и любая другая поисковая система, отреагирует вполне адекватно. В первых же строках ответа будут ссылки на ресурсы, которые и содержат фрагмент целиком. Скорее даже на сборники его произведений в открытом доступе для скачивания. Попробуйте с любым другим, введите цитату знаков на 100-200 из любой статьи. Подозреваю, что ссылка на эту именно статью также появится в самом начале. Лично я так поступаю всегда и обычно успешно. Роботы поисковиков ведь ранжируют находки по количеству совпадений, и лишь после этого оплаченный приоритет. Так что фишинговым сайтам, коммерческому трафику, нужно на своём ресурсе держать такой материал целиком. Никогда ведь не знаешь, какую именно цитату запросит пользователь. А вот набор слов и словосочетаний держать легко!

Вот и всё. Кажется, Онтология на этом завершена. Надеюсь всё понятно и доходчиво. Дополнительные пояснения приведу в Методологии и ещё дам в обзорах по каждому конкретному сегменту. Под 70 тыс. печатных знаков, как хотел, не уложился, получилось под сотню (даже без пробелов). Похоже, излишне много предлогов, союзов и междометий. Не беда, ладно. Зато понятно, что в дальнейшем устранять, над, чем работать, и на что обратить внимание. Благодарю дочитавшего до этого места за проявление колоссального терпения, да и терпимости. Буду признателен за конструктивную и не очень (да и «совсем не» тоже) критику, замечания, пожелания, вопросы и заявления. Метод будет в дальнейшем углубляться, разрабатываться и дорабатываться. А замыленный взгляд мешает иногда. Так что, ткнуть меня носом в очевидное и/или невероятное очень даже приветствуется.

...

Настоящий пост оканчивает онтологическую часть представляемого способа познания мира. Популярности (хотя бы по просмотрам), как видим, этот метод анализа не смог завоевать. Поэтому когда опубликую (если опубликую) методологию диалектического прагматизма, то видимо сделаю это фрагментарно, не в целостном виде, а… даже ещё не знаю как. Ладно, Бог не выдаст - свинья не съест, жив буду - придумаю что-нибудь.
Начало монографии в постах:

12.12.11 Диалектический прагматизм. Онтология. Принцип

13.12.11 Диалектический прагматизм. Онтология. Философия

14.12.11 Онтология. Философия (единство и борьба противоположностей и отрицание отрицания).

15.12.11 Онтология. Философия (физиократия и физическая экономика)

16.12.11 Онтология. Философия (релятивизм и прагматизм)

19.12.11 Диалектический прагматизм. Онтология. Антикритика

20.12.11 Онтология. Антикритика (либеральный закон и правовая система)

21.12.11 Онтология. Антикритика (радикализм и либертарианство, кейнсианство и монетаризм)

22.12.11 Онтология. Антикритика (эмиссия с инфляцией как прибыль в долг)

23.12.11 Диалектический прагматизм. Онтология. Глоссарий

27.12.11 Онтология. Глоссарий. Продолжение

28.12.11 Онтология. Глоссарий. Окончание

статистика, диалектический прагматизм, данные, Зиненко, онтология, информация, недвижимость

Previous post Next post
Up