1070Ti очень долгое применение разгона

Добрый день.

пытаюсь завести риг на 13 картах 1070Ti.
с 1060, P106 и радиками проблем не было.
а с этими долгая загрузка из-за очень длительного применения разгона - аж 7 минут!!!
пробовал на образах 0.5-53 и 05-32. (диск ssd).

выглядит это как то так:

Detected 13 NVIDIA cards
CLOCK = 150 150 150 150 150 150 150 150 150 150 150 150 150
MEM = 1300 1300 1300 1300 1300 1300 1300 1300 1300 1300 1300 1300 1300
FAN = 0 0 0 0 0 0 0 0 0 0 0 0 0
PLIMIT = 105 105 105 105 105 105 105 105 105 105 105 105 105

Persistence mode is already Enabled for GPU 00000000:01:00.0.
Persistence mode is already Enabled for GPU 00000000:02:00.0.
Persistence mode is already Enabled for GPU 00000000:03:00.0.
Persistence mode is already Enabled for GPU 00000000:04:00.0.
Persistence mode is already Enabled for GPU 00000000:05:00.0.
Persistence mode is already Enabled for GPU 00000000:06:00.0.
Persistence mode is already Enabled for GPU 00000000:09:00.0.
Persistence mode is already Enabled for GPU 00000000:0A:00.0.
Persistence mode is already Enabled for GPU 00000000:0B:00.0.
Persistence mode is already Enabled for GPU 00000000:0C:00.0.
Persistence mode is already Enabled for GPU 00000000:0D:00.0.
Persistence mode is already Enabled for GPU 00000000:0E:00.0.
Persistence mode is already Enabled for GPU 00000000:0F:00.0.
All done.

=== GPU 0, 01:00.0 GeForce GTX 1070 Ti, 36.04 W / 120.00 W (Default 180.00 W) === 09:53:00
Power limit for GPU 00000000:01:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:0]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:0]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:0]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:0]) assigned value
1300.
=== GPU 1, 02:00.0 GeForce GTX 1070 Ti, 37.47 W / 120.00 W (Default 180.00 W) === 09:54:03
Power limit for GPU 00000000:02:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:1]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:1]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:1]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:1]) assigned value
1300.
=== GPU 2, 03:00.0 GeForce GTX 1070 Ti, 36.43 W / 120.00 W (Default 180.00 W) === 09:54:50
Power limit for GPU 00000000:03:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:2]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:2]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:2]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:2]) assigned value
1300.
=== GPU 3, 04:00.0 GeForce GTX 1070 Ti, 37.00 W / 120.00 W (Default 180.00 W) === 09:55:28
Power limit for GPU 00000000:04:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:3]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:3]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:3]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:3]) assigned value
1300.
=== GPU 4, 05:00.0 GeForce GTX 1070 Ti, 36.18 W / 120.00 W (Default 180.00 W) === 09:56:02
Power limit for GPU 00000000:05:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:4]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:4]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:4]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:4]) assigned value
1300.
=== GPU 5, 06:00.0 GeForce GTX 1070 Ti, 36.46 W / 120.00 W (Default 180.00 W) === 09:56:35
Power limit for GPU 00000000:06:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:5]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:5]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:5]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:5]) assigned value
1300.
=== GPU 6, 09:00.0 GeForce GTX 1070 Ti, 35.79 W / 120.00 W (Default 180.00 W) === 09:57:06
Power limit for GPU 00000000:09:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:6]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:6]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:6]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:6]) assigned value
1300.
=== GPU 7, 0A:00.0 GeForce GTX 1070 Ti, 36.33 W / 120.00 W (Default 180.00 W) === 09:57:32
Power limit for GPU 00000000:0A:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:7]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:7]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:7]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:7]) assigned value
1300.
=== GPU 8, 0B:00.0 GeForce GTX 1070 Ti, 37.43 W / 120.00 W (Default 180.00 W) === 09:58:01
Power limit for GPU 00000000:0B:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:8]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:8]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:8]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:8]) assigned value
1300.
=== GPU 9, 0C:00.0 GeForce GTX 1070 Ti, 36.24 W / 120.00 W (Default 180.00 W) === 09:58:34
Power limit for GPU 00000000:0C:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:9]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:9]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:9]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:9]) assigned value
1300.
=== GPU 10, 0D:00.0 GeForce GTX 1070 Ti, 36.72 W / 120.00 W (Default 180.00 W) === 09:59:14
Power limit for GPU 00000000:0D:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:10]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:10]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:10]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:10]) assigned value
1300.
=== GPU 11, 0E:00.0 GeForce GTX 1070 Ti, 36.83 W / 120.00 W (Default 180.00 W) === 09:59:44
Power limit for GPU 00000000:0E:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:11]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:11]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:11]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:11]) assigned value
1300.
=== GPU 12, 0F:00.0 GeForce GTX 1070 Ti, 36.82 W / 120.00 W (Default 180.00 W) === 10:00:04
Power limit for GPU 00000000:0F:00.0 was set to 105.00 W from 120.00 W.
All done.
Attribute 'GPUPowerMizerMode' (V-1:0[gpu:12]) assigned value 1.
Attribute 'GPUFanControlState' (V-1:0[gpu:12]) assigned value 0.
Attribute 'GPUGraphicsClockOffset' (V-1:0[gpu:12]) assigned value 150.
Attribute 'GPUMemoryTransferRateOffset' (V-1:0[gpu:12]) assigned value
1300.

Comments

  • на самом деле проблема в высокой нагрузке CPU при обращении к GPU - kworker, irq/nvidia. load average показывает 12.0-18.0, при этом у проца не на одном ядре нет 100% загрузки. иногда что то происходит и нагрузка спадает меньше 1.0. но чаще остается большой, и от агента с большой задержкой приходят оповещения.
    температура и мощность не отображаются. хрень какая то(
  • edited June 10
    это все nvidia-smi + драйвера nvidia
    частые обращения к данной утилите, большое число карт (для 1070 и старше 9 и более) и другие причины ведут к таким голливудским эффектам
  • на тринадцати P106, 1060, RX таких проблем нет. везде ASROCK H110 BTC PRO.
    единственное, что проц G4560, а на всех остальных G3930. на днях попробую его махнуть.
  • пробовал обновить драйвер до 390.67. и ядро до 4.17.
    драйвер работает так же. а ядро не обновилось.
  • edited June 11
    Bio wrote: »
    на тринадцати P106, 1060, RX таких проблем нет. везде ASROCK H110 BTC PRO.
    единственное, что проц G4560, а на всех остальных G3930. на днях попробую его махнуть.
    Вы не сравнивайте теплое с мягким
    RX - это вообще отдельная история, на ригах до 8 карт включительно там часто околонулевая загрузка системы
    P106/ 1060 - это 3/6 Гб, а P106 еще и майнинг едишн - это как КАМАЗ для гонок (отличается от серийной).
    Замена процессора почти ничего не даст. Покрайней мере видел что i7 не сильно то помогает.
    на НВидиа загрузка растет - от числа карт, от объема видеопамяти (не точно но тенденция такая). Любой сбой в драйвере НВидиа сразу возбуждает все стадо - загрузка взлетает до небес.
    Не знаю что драйвер делает с системной шиной, но проблемы указывают на это.

    Проверьте, что значение скорости шины PCI-E - для х16 и х1 слотов установлено в Gen2

Sign In or Register to comment.