[must-read repost] Обманчиво простая задачка или немного про системное программирование

Nov 23, 2013 07:30

Если вы претендуете на то, чтобы быть называться программистом, это надо обязательно прочитать. Ну то есть много кто про это знает, но много кто, увы, нет.

Я в свое время славно походил по этим граблям, и у других их видел в количестве.

Оригинал взят у zamotivator в Обманчиво простая задачка или немного про системное программированиеВыношу из своего поста и ( Read more... )

repost, программирование, must-read

Leave a comment

nponeccop November 23 2013, 12:30:29 UTC
Наиболее печально, как мне кажется, в области юзер интерфейса и обычных аппов и сайтов. О хай-теке беспокоиться не надо, он сам справится.

Ассумпшены 10-летней давности о соотношении производительности разных компонентов системы не соответствуют действительности.

IO и CPU внезапно столько, хоть обожрись, а количество приложений, которые в состоянии их утилизировать - нулевое. Всё пишется, как будто у нас 1980-е на дворе, я хуею, дорогая редакция.

Какой-нибудь файловый серч в фаре запустить - плакать хочется. Я заранее знал что там говно, но сейчас специально посмотрел

http://farmanager.googlecode.com/svn/trunk/unicode_far/findfile.cpp

// Открываем файл

if(!file.Open(Name, FILE_READ_DATA, FILE_SHARE_READ|FILE_SHARE_WRITE, nullptr, OPEN_EXISTING, FILE_FLAG_SEQUENTIAL_SCAN))
{
return false;
}
...

// Основной цикл чтения из файла
while (!StopEvent.Signaled()
&& file.Read(readBufferA, (!SearchInFirst || alreadyRead + readBufferSize <= SearchInFirst)
? readBufferSize
: static_cast(SearchInFirst - alreadyRead), readBlockSize))

И это всё вызывается из однопоточного и синхронного же FindFiles::DoScanTree, первый класс вторая четверть, турбо паскаль под дос, чтение 1.44" на 286.

И такое везде, везде блядь.

Reply

wizzard0 November 23 2013, 13:09:23 UTC
ну да, поэтому фар выбрасываем нахуй и юзаем Everything, который отсканивает мои 8 млн файлов за 15 секунд и потом ищет за <30ms

Reply

nponeccop November 23 2013, 13:27:13 UTC
The interesting part of this example is that it's broken on so many levels

Reply

wizzard0 November 23 2013, 14:08:09 UTC
Maybe.

Reply

vp November 23 2013, 13:40:02 UTC
На обычном жестком диске? какая-то магия? :)

Reply

wizzard0 November 23 2013, 14:14:27 UTC
try it ;-)

Reply

vp November 23 2013, 14:17:55 UTC
Я верю, что оно может заиндексироваться до смерти и искать потом по своей базе. Но чудес не бывает. Полнотекстовый поиск - это чтение всего содержимого всех файлов. Параллельно загружать несколько потоков диски технически не могут, значит эта задача в общем случае не параллелится.

У вас ССД или обычный диск?

Reply

wizzard0 November 23 2013, 14:37:01 UTC
Не, не, не, не полнотекстовый. По именам. 15 сек занимает вычитать в память структуры NTFS.

Reply

vp November 23 2013, 14:54:22 UTC
Тьфу, у вас просто выше по тексту коммент с примером из фара - он меня сбил с толку, что речь о полнотекстовом поиске. Думаю, что за магия такая.

Reply

wizzard0 November 23 2013, 14:56:24 UTC
А, блин, в натуре сверху полнотекстовый.

Теперь я понял, о чем говорил nponeccop когда говорил что "wrong in so many ways" %)

Ыыы.

Reply

vp November 23 2013, 15:04:42 UTC
я у него спросил в жж то же самое - он меня забанил заскринил. Не знаете, за что? :)

http://nponeccop.livejournal.com/368146.html

Reply

vp November 23 2013, 15:16:22 UTC
Это все хорошо, но я думал, что вы именно о многопоточности. Вот потому и спросилось.

"...IO и CPU внезапно столько, хоть обожрись, а количество приложений, которые в состоянии их утилизировать - нулевое....Какой-нибудь файловый серч в фаре запустить - плакать хочется. Я заранее знал что там говно, но сейчас специально посмотрел"

Я естественным образом подумал, что вы о многопоточном поиске в файлах на одном диске в одной папке. Но раз вы о то, что Фар не использует возможности SATA - тогда прошу прощения. Действительно, это никуда не годится :)

Reply

nponeccop November 23 2013, 15:25:16 UTC
Да я обо всём сразу. В ЦПУ тоже упретесь, при поиске регуляркой в гигабайтном файле, при чтении с ССД и т.п.

Помимо этого есть простаивание конвейера во время системных вызовов, которое при многопоточности размазывается по ядрам и т.д.

Наконец, в винде есть апи дефрагментации, дающий информацию о физическом расположении файлов, т.е. если очень постараться, можно делать фуллскан на одном дыхании, без сиков, но это конечно не для фара а больше для системных искалок подходит.

Reply

vp November 23 2013, 15:28:34 UTC
спасибо, ваша мысль теперь понятна.

Reply

brainsucker November 23 2013, 21:36:43 UTC
Ай, ну вам не кажется что требовать этого от FAR-а с его тяжелой судьбой (и к тому же совсем не мэйнстрим продукта, странно что не загнулся ещё :) - это слишком? :) Да и писался этот код поиска кстати те самые 10 лет назад (в лучшем случае), так что все закономерно.

Если говорить про полно-текст - то в таком варианте фар показывает:
a. cp1251, case sensitive: > 100 мб/с @ 30%/1 cpu (очевидно уперся в веник)
b. all cp, case insensitive: 65 мб/с @ 100%/1 cpu
Что имхо вполне достаточно (и тем более на порядок быстрее вы не сделаете) для повседневных задач большинства юзверей с обычными hdd. Про прогулку по папкам - другой вопрос.

Безусловно можно сделать намного лучше и там и там, что мешает засабмитить патч? :) Видно по тем же причинам никто до сих пор и не засабмитил :)

Reply


Leave a comment

Up