Методика быстрого поиска дубликатов - 3

Dec 02, 2015 23:09

Оригинал взят у chispa1707 в Методика быстрого поиска дубликатов - 3
Показываю реальное Эксель-ОМП - на 22918 строк.
Пока не случился вирус, у меня только на одном листе было 172 столбца, то есть, порядка 3,9 миллиона полных яеек с формулами.
И таких листов было три, и машина их нормально тянула. Комп не крутой, просто Эксель-2007 действительно хорош )

Суть дела: формула ВПР позволяет отыскать точное соответствие значению. На это и опора.
Сначала создаем образцовый массив - объединением индексов региона, типа катаклизма и даты - через запятую, например.
Как объединить? Вот у Вас три столбца: регион, тип катаклизма и год. Выделяем все три, копируем и вставляем в Блокнот.
В блокноте выделяем и копируем интервал, меняем его на запятую (например) и вставляем обратно в Эксель.



В результате получаем объединенные данные. Я их выделил красным.



Здесь этот столбец под латинской буквой A.
В столбце "С" - год события.
В столбце "D" - год события плюс размер сдвига (выделено красно-желтым).
Формула (она в строке формул) очень проста. Главное, впиндюрить знак доллара там, где надо



Следующий столбец - искомое.
К китайской (cn) комете (к) в 13 году от Р. Х. надо подобрать пару - китайскую же комету, на прошедшую на 23 года позже - в 36 году от Р. Х.
Если такой кометы нет, в ячейке появится символ #Н/Д
Формула объединения двух значений из двух столбцов - в строке формул. По СТРУКТУРЕ данные столбца "E" такие же, как и в столбце "А".
Разница только в дате события.



И последний необходимый столбец - та самая формула ВПР. Формула видна.
Внизу - фрагмент, в котором видно соответствие. Китайская комета 84 года имеет дубликат через 23 года - в 107 году.
И формула на эту дату точно указывает напротив эталонного события в 84 году.
Чтобы колонка не весила много, ее надо откопировать, перенести в другое место и вставить через специальную вставку, как ЗНАЧЕНИЕ.
А значки #Н/Д оптом меняем на ничто через функцию "найти и заменить". Зачем нам лишний вес файла?



Если комп Вам это позволяет, это удобнее делать на трех листах одновременно. Каждому типу столбцов - отдельный лист.
Тогда мы работаем оптом, со всем массивом, и колонки не надо копировать поштучно - получаем результат по всему массиву.
В итоге имеем серии дубликатов под каждым типом сдвига. Я таких на 169 типов сдвига получил около полумиллиона.
Всего-то часов за пять-шесть. И с этим массивом работать уже можно.



Главное отличие от всех предыдущих методик: у нас есть очень точное соответствие событий - китайская комета соизмеряется именно с китайскими кометами, а не с итальянскими извержениями. И в такой ситуации хронологические подлоги в принципе доказуемы.

Эксель, технология, история, НХ

Previous post Next post
Up