Сравнение i7-4790K + NVidia GTX 980 vs i7-9700K + NVidia GTX 1080 Ti на нейросетевой задаче

Dec 09, 2018 10:27

В отличие от тестов на userbenchmark.com сравнивнение сделано на реальной практической задаче nn_wordcopy3.py. Предметная область - NLP. Данные для обучения одинаковые.

Программное окружение в обоих случаях практически идентично - Ubuntu, Python 2, текущие версии tensorflow, CUDA 9.0. В обоих случаях видно, что все ядра CPU загружены, хотя и не полностью. Формально оба CPU держат 8 потоков, но у i7-9700 это 8 реальных ядер, а у i7-4790 4 ядра с гипертредингом. Но основная нагрузка лежит на GPU.

Машина №1 i7-4790K, 32 Гб памяти DDR3, NVidia GTX 980, материнская плата MSI H97 GAMING.
Детальная инфа (выдача sudo lshw и nvidia-smi):


product: MS-7918 (To be filled by O.E.M.)
vendor: MSI
version: 1.0
serial: To be filled by O.E.M.
width: 64 bits
capabilities: smbios-2.8 dmi-2.7 vsyscall32
configuration: administrator_password=disabled boot=normal chassis=desktop family=To be filled by O.E.M. frontpanel_password=disabled keyboard_password=disabled power-on_password=disabled sku=To be filled by O.E.M. uuid=00000000-0000-0000-0000-D8CB8A6FE07A
*-core
description: Motherboard
product: H97 GAMING 3 (MS-7918)
vendor: MSI
physical id: 0
version: 1.0
serial: To be filled by O.E.M.
slot: To be filled by O.E.M.
*-firmware
description: BIOS
vendor: American Megatrends Inc.
physical id: 0
version: V1.7
date: 12/24/2014
size: 64KiB
capacity: 15MiB
capabilities: pci upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
*-cpu
description: CPU
product: Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
vendor: Intel Corp.
physical id: 3d
bus info: cpu@0
version: Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
slot: SOCKET 0
size: 4155MHz
capacity: 4400MHz
width: 64 bits
clock: 100MHz
capabilities: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm cpuid_fault invpcid_single pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid xsaveopt dtherm ida arat pln pts flush_l1d cpufreq
configuration: cores=4 enabledcores=4 threads=8
*-cache:0
description: L1 cache
physical id: 3e
slot: CPU Internal L1
size: 256KiB
capacity: 256KiB
capabilities: synchronous internal write-back
configuration: level=1
*-cache:1
description: L2 cache
physical id: 3f
slot: CPU Internal L2
size: 1MiB
capacity: 1MiB
capabilities: synchronous internal write-back unified
configuration: level=2
*-cache:2
description: L3 cache
physical id: 40
slot: CPU Internal L3
size: 8MiB
capacity: 8MiB
capabilities: synchronous internal write-back unified
configuration: level=3
*-memory
description: System Memory
physical id: 42
slot: System board or motherboard
size: 32GiB
*-bank:0
description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
product: DDR3 1600 2OZ
vendor: Fujitsu
physical id: 0
serial: 0000C437
slot: ChannelA-DIMM0
size: 8GiB
width: 64 bits
clock: 1600MHz (0.6ns)
*-bank:1
description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
product: DDR3 1600 2OZ
vendor: Fujitsu
physical id: 1
serial: 0000C447
slot: ChannelA-DIMM1
size: 8GiB
width: 64 bits
clock: 1600MHz (0.6ns)
*-bank:2
description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
product: DDR3 1600G 2OZ
vendor: Fujitsu
physical id: 2
serial: 00002C4E
slot: ChannelB-DIMM0
size: 8GiB
width: 64 bits
clock: 1600MHz (0.6ns)
*-bank:3
description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
product: DDR3 1600G 2OZ
vendor: Fujitsu
physical id: 3
serial: 00002C7C
slot: ChannelB-DIMM1
size: 8GiB
width: 64 bits
clock: 1600MHz (0.6ns)

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.130 Driver Version: 384.130 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 980 Off | 00000000:01:00.0 Off | N/A |
| 34% 61C P2 82W / 195W | 3869MiB / 4038MiB | 89% Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1235 G /usr/lib/xorg/Xorg 105MiB |
| 0 1683 G compiz 37MiB |
| 0 2437 C python 3713MiB |
+-----------------------------------------------------------------------------+

Машина №2 i7-9700K, 64 Гб памяти DDR4, NVidia GTX 1080 Ti, материнская плата MSI Z390 CARBON GAMING
Выдача sudo lshw и nvidia-smi:


продукт: MS-7B17 (Default string)
производитель: Micro-Star International Co., Ltd.
версия: 1.0
серийный №: Default string
разрядность: 64 bits
возможности: smbios-2.8 dmi-2.8 smp vsyscall32
конфигурация: boot=normal chassis=desktop family=Default string sku=Default string uuid=00000000-0000-0000-0000-00D8611296B4
*-core
описание: Материнская плата
продукт: MPG Z390 GAMING PRO CARBON (MS-7B17)
производитель: Micro-Star International Co., Ltd.
физический ID: 0
версия: 1.0
серийный №: IA16401559
слот: Default string
*-firmware
описание: BIOS
производитель: American Megatrends Inc.
физический ID: 0
версия: 1.00
date: 09/03/2018
размер: 64KiB
capacity: 15MiB
возможности: pci upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
*-memory
описание: Системная память
физический ID: 39
слот: Системная плата или материнская плата
размер: 64GiB
*-bank:0
описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
продукт: CMU64GX4M4C3000C15
производитель: AMI
физический ID: 0
серийный №: 00000000
слот: ChannelA-DIMM0
размер: 16GiB
разрядность: 64 bits
частота: 2133MHz (0.5ns)
*-bank:1
описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
продукт: CMU64GX4M4C3000C15
производитель: AMI
физический ID: 1
серийный №: 00000000
слот: ChannelA-DIMM1
размер: 16GiB
разрядность: 64 bits
частота: 2133MHz (0.5ns)
*-bank:2
описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
продукт: CMU64GX4M4C3000C15
производитель: AMI
физический ID: 2
серийный №: 00000000
слот: ChannelB-DIMM0
размер: 16GiB
разрядность: 64 bits
частота: 2133MHz (0.5ns)
*-bank:3
описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
продукт: CMU64GX4M4C3000C15
производитель: AMI
физический ID: 3
серийный №: 00000000
слот: ChannelB-DIMM1
размер: 16GiB
разрядность: 64 bits
частота: 2133MHz (0.5ns)
*-cache:0
описание: L1 кэш
физический ID: 43
слот: L1 Cache
размер: 512KiB
capacity: 512KiB
возможности: synchronous internal write-back unified
конфигурация: level=1
*-cache:1
описание: L2 кэш
физический ID: 44
слот: L2 Cache
размер: 2MiB
capacity: 2MiB
возможности: synchronous internal write-back unified
конфигурация: level=2
*-cache:2
описание: L3 кэш
физический ID: 45
слот: L3 Cache
размер: 12MiB
capacity: 12MiB
возможности: synchronous internal write-back unified
конфигурация: level=3
*-cpu
описание: ЦПУ
продукт: Intel(R) Core(TM) i7-9700K CPU @ 3.60GHz
производитель: Intel Corp.
физический ID: 46
сведения о шине: cpu@0
версия: Intel(R) Core(TM) i7-9700K CPU @ 3.60GHz
серийный №: To Be Filled By O.E.M.
слот: U3E1
размер: 4600MHz
capacity: 4900MHz
разрядность: 64 bits
частота: 100MHz
возможности: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch cpuid_fault invpcid_single ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm mpx rdseed adx smap clflushopt intel_pt xsaveopt xsavec xgetbv1 xsaves dtherm ida arat pln pts hwp hwp_notify hwp_act_window hwp_epp flush_l1d arch_capabilities cpufreq
конфигурация: cores=8 enabledcores=8 threads=8

GPU:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 390.87 Driver Version: 390.87 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:01:00.0 Off | N/A |
| 34% 63C P2 128W / 280W | 10806MiB / 11178MiB | 79% Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1865 G /usr/lib/xorg/Xorg 226MiB |
| 0 2078 G /usr/bin/gnome-shell 196MiB |
| 0 2435 G /proc/self/exe 70MiB |
| 0 3013 G /opt/teamviewer/tv_bin/TeamViewer 24MiB |
| 0 3641 G /usr/lib/firefox/firefox 2MiB |
| 0 8516 C python 10281MiB |
+-----------------------------------------------------------------------------+

В итоге, на первой машине одна эпоха обучения занимает ~27 секунд. На второй машине ~7 секунд. То есть вторая машина почти в 4 раза быстрее.

nlp, gtx 1080, nvidia, benchmark

Previous post Next post
Up