Опять весна, опять грачи, опять на бедных студиозусов сыплются дипломные работы, а с ними - требования уникальности по "Антиплагиат.ру
( Read more... )
Ужас. Жена рассказывала, что у её приятельницы по "Антиплагиату" завалили диссертацию, потому что диссертация содержала фрагменты её же статей. Зашёл посмотреть на сам "Антиплагиат" и не увидел никаких настроек. Ужас ещё и в том, что кое-как сработанную систему, я уж не знаю, по сравнению с seo - это уровень 15-летней давности, наверное, тупую сравнивалку текстов, пытаются использовать как какой-то искусственный интеллект. Чтобы плагиатом не оказывались фразы "состав семьи", "несанкционированные врезки" используется "длина шингла", т.е., последовательность скольких слов проверяется. "состав семьи" - это шингл 2 (2 слова). Я сейчас прочитал, что нереально требовать 100% уникальность с шинглом 3. И это на словесной пачкотне для набивания сайтов. В научной литературе я вообще не знаю, какова должна быть оптимальная уникальность, если там могут быть (или даже должны быть) обширные цитаты из законов или стандартные фразы типа "Опыт был произведён на оборудовании ЧихПых 25 с соблюдением всех необходимых условий". И повторюсь - препод должен смотреть текст. Если там написано "опыт был произведён с соблюдением следующих условий" и дальше цитата из инструкции к оборудованию - это одно. Если написано "я вчера провел опыт и пришёл к выводу что", а дальше две страницы, выложенные на всех сайтах с рефератами, переписанные с ошибками из учебника 1969 года - это другое. Потому что "Антиплагиат" - это не искусственный интеллект, выносящий безоговорочный приговор, а, в лучшем случае, инструмент, с которым надо работать, а не на 3 циферки смотреть.
Жена рассказывала, что у её приятельницы по "Антиплагиату" завалили диссертацию, потому что диссертация содержала фрагменты её же статей.
Зашёл посмотреть на сам "Антиплагиат" и не увидел никаких настроек.
Ужас ещё и в том, что кое-как сработанную систему, я уж не знаю, по сравнению с seo - это уровень 15-летней давности, наверное, тупую сравнивалку текстов, пытаются использовать как какой-то искусственный интеллект.
Чтобы плагиатом не оказывались фразы "состав семьи", "несанкционированные врезки" используется "длина шингла", т.е., последовательность скольких слов проверяется. "состав семьи" - это шингл 2 (2 слова). Я сейчас прочитал, что нереально требовать 100% уникальность с шинглом 3. И это на словесной пачкотне для набивания сайтов. В научной литературе я вообще не знаю, какова должна быть оптимальная уникальность, если там могут быть (или даже должны быть) обширные цитаты из законов или стандартные фразы типа "Опыт был произведён на оборудовании ЧихПых 25 с соблюдением всех необходимых условий".
И повторюсь - препод должен смотреть текст. Если там написано "опыт был произведён с соблюдением следующих условий" и дальше цитата из инструкции к оборудованию - это одно. Если написано "я вчера провел опыт и пришёл к выводу что", а дальше две страницы, выложенные на всех сайтах с рефератами, переписанные с ошибками из учебника 1969 года - это другое.
Потому что "Антиплагиат" - это не искусственный интеллект, выносящий безоговорочный приговор, а, в лучшем случае, инструмент, с которым надо работать, а не на 3 циферки смотреть.
Reply
Слово "самоцитирование" для учёных мужей слишком сложнае, да.
Ага, шинглы или N-граммы, имеют полное право быть в тексте ДО определенного процента.
В российской науке две беды - то микроскопом гвозди заколачивают, то при помощи молотка пытаются расшифровать геном коронавируса.
Reply
Leave a comment