О клиентах Диссернета -- 5 (расклад по научным дисциплинам)

Feb 08, 2015 16:23


Это, собственно, извлеклось и посчиталось одним из первых, но почему-то руки не доходили выложить. Это кусочки кандидатской или докторской степеней, от которых откушены слова «кандидат» или «доктор». Всего это поле заполнено в 644 записях из 648.
Картинку и таблицу под cut... )

r, диссернет

Leave a comment

ascir February 8 2015, 14:27:28 UTC
Насколько на эти данные влияет sampling bias? Биологов мало потому, что они мало подделывают диссеры, или потому, что их степени не интересны никому тем, кто занимается проверками?

Reply

kouprianov February 8 2015, 14:49:33 UTC
Насколько я понимаю, открытая часть базы, которую можно взять на сайте Диссернета (я, собственно, ее так и "взял") -- это не все, кто попал в диссерорубку, а только чиновники определенных уровней и депутаты. Небольшое количество биологов, скорее, связано с тем, что их степени неинтересны (как "непрофильные") тем, кто делает чиновную / политическую карьеру.

Вопрос о sampling bias может быть решен удовлетворительно только после того, когда мы поймем, что принять за генеральную совокупность: всех обладаетелй ученых степеней или всех остепененных чиновников / депутатов.

Reply

ascir February 8 2015, 16:12:33 UTC
В общем, оба варианта приемлемы, но надо это в явной форме указывать тогда.

Если чиновники и депутаты - тогда всё понятно, к.б.н.'ов и д.б.н.'ов среди них мало.

Reply

serqwert February 9 2015, 10:31:26 UTC
открытая часть базы, которую можно взять на сайте Диссернета - это не все, кто попал в диссерорубку, а только чиновники определенных уровней и депутаты

С чего Вы взяли? Мне кажется, кто-то из отцов-основателей писал, что чаще всего там встречаются сотрудники вузов. Среди последних десяти (на сегодняшний день) выложенных экспертиз у трёх клиентов должность и место работы неизвестны. Может быть и статистику по местам работы имеет смысл навести, раз уж Вы взялись?

А sampling bias в любом случае охрененный, поскольку эксперты диссернета предпочитают работать не впустую и тратят своё время в основном на тех, кто в силу каких-то причин вызывает определённые подозрения. Плюс тотальные проверки отдельных категорий (сенаторы, депутаты Думы, ректора).

Reply

kouprianov February 10 2015, 22:01:59 UTC
Сотрудники вузов, полагаю, это руководители, рецензенты и члены советов. С авторами сложнее.

Места работы я попробую еще вынуть, но там килограмм проблем.

Reply

serqwert February 10 2015, 22:29:18 UTC
Насколько я помню, утверждалось, что среди авторов наибольшую долю составляют сотрудники вузов (преподаватели и руководство), а не чиновники, как это принято полагать.
Среди руководителей и оппонентов - само собой, тут вопрос в том, насколько доля сотрудников вузов близка к 100%.

Reply

kouprianov February 10 2015, 22:31:28 UTC
Если получится вынуть, посмотрим. В довершение всех бед, там еще и два комплекта страниц -- одни с карточками авторов, другие -- с карточками диссертаций, что совершенно не облегчает работу по сведению в единый dataset.

Reply

kouprianov February 11 2015, 06:49:40 UTC
Еще одна плохая новость. На карточке автора не столько места работы с должностями, сколько общие характеристики деятельности ("Росcийский историк и политик, профессор МГУ им. М. В. Ломоносова" или "Депутат Законодательного собрания Санкт-Петербурга от <<Единой России>>"), и не у всех, похоже. С этим каши не сваришь, по большому счету, многое придется перекодировать.

Reply


Leave a comment

Up