Comments | kouprianov: О клиентах Диссернета -- 5 (расклад по научным дисциплинам)

kouprianov

О клиентах Диссернета -- 5 (расклад по научным дисциплинам)

Feb 08, 2015 16:23

Это, собственно, извлеклось и посчиталось одним из первых, но почему-то руки не доходили выложить. Это кусочки кандидатской или докторской степеней, от которых откушены слова «кандидат» или «доктор». Всего это поле заполнено в 644 записях из 648.
( Картинку и таблицу под cut... )

r, диссернет

Comments 12

ascir February 8 2015, 14:27:28 UTC

Насколько на эти данные влияет sampling bias? Биологов мало потому, что они мало подделывают диссеры, или потому, что их степени не интересны никому тем, кто занимается проверками?

kouprianov February 8 2015, 14:49:33 UTC

Насколько я понимаю, открытая часть базы, которую можно взять на сайте Диссернета (я, собственно, ее так и "взял") -- это не все, кто попал в диссерорубку, а только чиновники определенных уровней и депутаты. Небольшое количество биологов, скорее, связано с тем, что их степени неинтересны (как "непрофильные") тем, кто делает чиновную / политическую карьеру.

Вопрос о sampling bias может быть решен удовлетворительно только после того, когда мы поймем, что принять за генеральную совокупность: всех обладаетелй ученых степеней или всех остепененных чиновников / депутатов.

ascir February 8 2015, 16:12:33 UTC

В общем, оба варианта приемлемы, но надо это в явной форме указывать тогда.

Если чиновники и депутаты - тогда всё понятно, к.б.н.'ов и д.б.н.'ов среди них мало.

serqwert February 9 2015, 10:31:26 UTC

открытая часть базы, которую можно взять на сайте Диссернета - это не все, кто попал в диссерорубку, а только чиновники определенных уровней и депутаты

С чего Вы взяли? Мне кажется, кто-то из отцов-основателей писал, что чаще всего там встречаются сотрудники вузов. Среди последних десяти (на сегодняшний день) выложенных экспертиз у трёх клиентов должность и место работы неизвестны. Может быть и статистику по местам работы имеет смысл навести, раз уж Вы взялись?

А sampling bias в любом случае охрененный, поскольку эксперты диссернета предпочитают работать не впустую и тратят своё время в основном на тех, кто в силу каких-то причин вызывает определённые подозрения. Плюс тотальные проверки отдельных категорий (сенаторы, депутаты Думы, ректора).

Thread 8

grey_dolphin February 9 2015, 14:28:24 UTC

маловато политических и социологических наук, я ожидал большего

видимо, экономические и юридические науки поглотили львиную долю клиентуры, и другим дисциплинам мало что осталось...

kouprianov February 10 2015, 22:07:13 UTC

Общее распределение крайне асимметричное. Вторая позиция почти не отличается от третьей, при таком отрыве первой -- я чего-то такого в естественных распределениях научной продуктивности не припомню. Сдается, что там какой-то кусок айсберга пока не виден.

serqwert February 10 2015, 22:37:37 UTC

Огромный кусок айсберга должен быть не виден, поскольку никаких усилий по репрезентативности не предпринимается. Ищут, условно говоря, под фонарём - наткнулись случайным образом на наглое жульничество и копают: а что ещё было в том же совете или у того же руководителя. И эта стратегия даёт плоды в смысле расширения списка уличённых.

kouprianov February 10 2015, 22:49:00 UTC

Сам по себе метод не хорош и не плох (и без программы господдержки я не вижу способов перехода к полностью рандомизированной выборке изо всего пула диссертаций). Главное, я пока не понимаю, зачем тут вообще репрезентативность, по большому счету? Т. е., да, по репрезентативной выборке можно будет ответить на ряд дополнительных вопросов (по большому счету, не имеющих большого прикладного и фундаментального значения). А на какие-то, напротив, ответить будет нельзя. Например, структура социальной сети при помощи рандомизированной выборки исследована быть не может, тут снежный ком всочетании с рядом других подходов дает больше или, во всяк. сл., не меньше.