О клиентах Диссернета -- 5 (расклад по научным дисциплинам)

Feb 08, 2015 16:23


Это, собственно, извлеклось и посчиталось одним из первых, но почему-то руки не доходили выложить. Это кусочки кандидатской или докторской степеней, от которых откушены слова «кандидат» или «доктор». Всего это поле заполнено в 644 записях из 648.
Картинку и таблицу под cut... )

r, диссернет

Leave a comment

Comments 12

ascir February 8 2015, 14:27:28 UTC
Насколько на эти данные влияет sampling bias? Биологов мало потому, что они мало подделывают диссеры, или потому, что их степени не интересны никому тем, кто занимается проверками?

Reply

kouprianov February 8 2015, 14:49:33 UTC
Насколько я понимаю, открытая часть базы, которую можно взять на сайте Диссернета (я, собственно, ее так и "взял") -- это не все, кто попал в диссерорубку, а только чиновники определенных уровней и депутаты. Небольшое количество биологов, скорее, связано с тем, что их степени неинтересны (как "непрофильные") тем, кто делает чиновную / политическую карьеру.

Вопрос о sampling bias может быть решен удовлетворительно только после того, когда мы поймем, что принять за генеральную совокупность: всех обладаетелй ученых степеней или всех остепененных чиновников / депутатов.

Reply

ascir February 8 2015, 16:12:33 UTC
В общем, оба варианта приемлемы, но надо это в явной форме указывать тогда.

Если чиновники и депутаты - тогда всё понятно, к.б.н.'ов и д.б.н.'ов среди них мало.

Reply

serqwert February 9 2015, 10:31:26 UTC
открытая часть базы, которую можно взять на сайте Диссернета - это не все, кто попал в диссерорубку, а только чиновники определенных уровней и депутаты

С чего Вы взяли? Мне кажется, кто-то из отцов-основателей писал, что чаще всего там встречаются сотрудники вузов. Среди последних десяти (на сегодняшний день) выложенных экспертиз у трёх клиентов должность и место работы неизвестны. Может быть и статистику по местам работы имеет смысл навести, раз уж Вы взялись?

А sampling bias в любом случае охрененный, поскольку эксперты диссернета предпочитают работать не впустую и тратят своё время в основном на тех, кто в силу каких-то причин вызывает определённые подозрения. Плюс тотальные проверки отдельных категорий (сенаторы, депутаты Думы, ректора).

Reply


grey_dolphin February 9 2015, 14:28:24 UTC
маловато политических и социологических наук, я ожидал большего

видимо, экономические и юридические науки поглотили львиную долю клиентуры, и другим дисциплинам мало что осталось...

Reply

kouprianov February 10 2015, 22:07:13 UTC
Общее распределение крайне асимметричное. Вторая позиция почти не отличается от третьей, при таком отрыве первой -- я чего-то такого в естественных распределениях научной продуктивности не припомню. Сдается, что там какой-то кусок айсберга пока не виден.

Reply

serqwert February 10 2015, 22:37:37 UTC
Огромный кусок айсберга должен быть не виден, поскольку никаких усилий по репрезентативности не предпринимается. Ищут, условно говоря, под фонарём - наткнулись случайным образом на наглое жульничество и копают: а что ещё было в том же совете или у того же руководителя. И эта стратегия даёт плоды в смысле расширения списка уличённых.

Reply

kouprianov February 10 2015, 22:49:00 UTC
Сам по себе метод не хорош и не плох (и без программы господдержки я не вижу способов перехода к полностью рандомизированной выборке изо всего пула диссертаций). Главное, я пока не понимаю, зачем тут вообще репрезентативность, по большому счету? Т. е., да, по репрезентативной выборке можно будет ответить на ряд дополнительных вопросов (по большому счету, не имеющих большого прикладного и фундаментального значения). А на какие-то, напротив, ответить будет нельзя. Например, структура социальной сети при помощи рандомизированной выборки исследована быть не может, тут снежный ком всочетании с рядом других подходов дает больше или, во всяк. сл., не меньше.

Reply


Leave a comment

Up