Во имя науки!

Aug 31, 2010 23:35

Дорогие друзья, мне нужна некоторая помощь для отладки/проверки программы.
Если:
1) Ты счастливый обладатель видеокарты от Nvidia
2) У тебя стоит Windows XP|Vista|7
3) У тебя есть около двух свободных минут времени
4) Должны стоять последние драйвера на видеокарту (т.е 258.96)! Скачать их можно тут: Read more... )

Leave a comment

juk_vasilev September 1 2010, 12:26:34 UTC
таки совсем другое дело!

device name: GeForce 8400M G <----- creating CUcontext on this
device sharedMemPerBlock: 16384
device totalGlobalMem: 253296640
device regsPerBlock: 8192
device warpSize: 32
device memPitch: 2147483647
device maxThreadsPerBlock: 512
device maxThreadsDim[0]: 512
device maxThreadsDim[1]: 512
device maxThreadsDim[2]: 64
device maxGridSize[0]: 65535
device maxGridSize[1]: 65535
device maxGridSize[2]: 1
device totalConstMem: 65536
device major: 1
device minor: 1
device clockRate: 800000
device textureAlignment: 256
device deviceOverlap: 0
device multiProcessorCount: 1

Square pairs: normal 1.00

Pair: 100 - 100
Processing time: 63 (ms)
first: 200, second: 100, third: 100, result: 1.000000

Pair: 300 - 300
Processing time: 63 (ms)
first: 600, second: 300, third: 300, result: 1.000000

Pair: 512 - 512
Processing time: 63 (ms)
first: 1024, second: 512, third: 512, result: 1.000000

Pair: 1019 - 1019
Processing time: 93 (ms)
first: 2038, second: 1019, third: 1019, result: 1.000000

Pair: 1024 - 1024
Processing time: 78 (ms)
first: 2048, second: 1024, third: 1024, result: 1.000000

Pair: 5792 - 5792
Processing time: 952 (ms)
first: 11584, second: 5792, third: 5792, result: 1.000000

Pair: 5793 - 5793
Processing time: 733 (ms)
first: 0, second: 5793, third: 5793, result: 0.000000

Pair: 8189 - 8189
Processing time: 125 (ms)
first: 1863845303, second: -1765455562, third: -1765455562, result: 2.439409

Pair: 11583 - 11583
Processing time: 125 (ms)
first: 55568325, second: 715625715, third: 715625715, result: 0.038825

Not square pairs

Pair: 30000 - 3
Processing time: 46 (ms)
first: 6, second: 30000, third: 3, result: 0.000200

Pair: 30000 - 300
Processing time: 281 (ms)
first: 600, second: 30000, third: 300, result: 0.019802

Pair: 300000 - 3
Processing time: 94 (ms)
first: 6, second: 300000, third: 3, result: 0.000020

Pair: 300000 - 30
Processing time: 296 (ms)
first: 60, second: 300000, third: 30, result: 0.000200

Pair: 300000 - 300
Processing time: 124 (ms)
first: 55516877, second: 14828332, third: 7422568, result: 2.495040

Pair: 300000 - 3000
Processing time: 109 (ms)
first: -1681593146, second: 14849932, third: -1681571553, result: 1.008923

Thanks!

Reply

al_indigo September 1 2010, 14:11:50 UTC
Спасибо!
Вообще, результаты меня чуть-чуть удивляют, так что очень хорошо, что у тебя дошли руки до этого, и ты не забыл. Надо будет теперь основательно подумать) У тебя не у одного они причём такие, похоже, где-то есть подводный камень, который я не заметил

Reply

juk_vasilev September 1 2010, 20:08:56 UTC
А в чём проблема, что неожиданно?

Reply

al_indigo September 1 2010, 20:25:34 UTC
Если совсем вкратце -- я выбирал эти значения не случайно, а по градации классов видеокарт. И на твоей видеокарте, по моим расчётам, моя программа должна была начать выдавать неправильные значения уже на размере 2897*2897. Тем не менее, программа работает почему-то правильно даже на 5792 (т.е, как у меня). Это немного загадочно, потому что у меня 512мб на борту видюхи, а у тебя вдвое меньше, при этом я думал, что ограничение 5792 возникает из-за нехватки памяти. Так вот, если у тебя это значение тоже отрабатывается правильно, значит, моё предположение было не верно, значит, я где-то облажался в расчётах измерений ядра, и значит, потенциально я где-то наговнил так, что это всплывёт в самом неожиданном месте.

А проблема заключается в том, что почти невозможно отловить место, где я налажал, ошибки я вижу уже постфактум и не совсем в тех местах, где они происходят (вообще говоря, если бы я не убрал собственные ассёрты, у тебя программа должна была просто вылететь в какой-то момент, по идее). А т.к отладка на gpu устроена несколько иначе, я в некотором тупике

Теперь мне нужен человек, у которого на борту видюхи хотя бы гигабайт памяти, тогда я смогу хотя бы примерно найти место, где копать (если знаешь, кстати, кого-нибудь, у кого есть гиг, попробуй у него это запустить :) )
А сейчас это как искать иголку в стоге сена -- налажать я мог буквально где угодно, к сожалению

Reply

juk_vasilev September 1 2010, 20:34:14 UTC
такой человек - Фро)))
На нашем большом компе у видюхи гиг как раз, я думаю. Правда, она ATI, а это, видимо, критично.

Reply

al_indigo September 1 2010, 20:42:57 UTC
Да, пока что критично. Когда я доотлажу эту версию, я, возможно, перепишу всё на OpenCl, тогда будет идти на чём угодно -- от любых видеокарт до процессоров, тогда можно будет и попробовать) Но это не раньше октября

Reply


Leave a comment

Up