У Гугля есть интересный сервис -
Ngram Viewer - поисковый онлайн-сервис компании Google, позволяющий строить графики частотности языковых единиц на основе огромного количества печатных источников, опубликованных с 16 века и собранных в сервис Google Books. Там можно посмотреть частоту использования слов или словосочетаний.
Например, в/на Украине:
Очевидно, что правильным и естественным для русского языка является употребление предлога "на".
Или украинец:
Очевидно, что время рождения т.н. "украинцев" - начало 20 века.