⚠この記事はブログ移転前のアーカイブです

今の環境でGPUドライバが落ちる問題が頻発するようになった。

CPU Intel i7 10710U
RAM 32GB
GPU Intel UHD
GPU GTX 1650 Max-Q
GPU (eGPU) RTX 2060 with Razer Core X Chroma

GTX 1650 Max-Qはノート内蔵のGPUで、optimusによって動的に使用できるGPUだ。かなりトリッキーな構成なので不安定になる要素満載ではあるものの、全く使用できない状態になってしまい、直すのにも手こずったのでメモ。

症状

  • Youtubeなどの動画サイトを閲覧していると画面がフリーズ、またはブルスク発生
  • イベントには「ソース “nvlddmkm” からのイベント ID 14 の説明が見つかりません。」とドライバロードの失敗が記録
  • ベンチマークやゲームは快適に使用できる。
  • 動画も最初は快適に使用できる
    • クラッシュのタイミングがまちまち

といった具合だ。

やったこと

症状を改善するためにやったことと効果を書いておく

ドライバのダウングレード

DDUを使用してドライバを完全削除した。

DDU公式 – https://www.wagnardsoft.com/

また、Nvidiaの公式サイトから適当に古めのドライバDCH版)をいくつかDLしておく

Nvidia ドライバダウンロード – https://www.nvidia.co.jp/Download/Find.aspx?lang=jp

結果としては変わらずだった。今は後述の対策で改善しているものの、怖いので2021年4月のドライバがあたったままになっている。

ケーブル交換

Thunderbolt 3 ケーブルは摩耗しやすいらしい。ダメ元でケーブルを買ってみた。

結果はだめ。Thunderboltケーブルって結構高いのでちょっと悲しかった。

Chrome 設定変更

Youtubeやniconicoの動画再生時に頻発することはわかっていたので、Chromeの設定で「ハードウェアアクセラレーション」をオフにしてGPUの使用を止めた。

結果は変わらず。しかし頻度が低下したように思う。最初はこれで解決かとお思って再発したときは膝から崩れ落ちた。

Razer Core X Chroma の設定変更

eGPUボックスとしてRazer Core X Chromaを使用している。この製品は他のと違ってGigabit Ethernet やUSBポートを装備している。一説によると、ただでさえ狭いThunderbolt 3の帯域を圧迫する上、あまり安定しないらしい。

デバイスドライバからイーサネットのドライバを無効化してみた

結果は変わらず。

Nvidiaコントロールパネル設定 (正解)

結果直ったものがこちら

razer core x constantly freezes/crashes lenovo c940

I don’t know if this helps, but I found out that RTX 20xx cards will crash and freeze the system randomly unless you set the Power Management Mode in the NVidia CP to **Prefer Maximum Performance. **The default Optimal Power caused my system (Razer Blade 13 1650) to randomly freeze when the Core X was connected. I replaced 2 brand new RTX 2060 Super, reinstalled Windows and drivers countless times trying to troubleshoot this. Interesting thing is that if I used my old GTX Titan it worked fine, that’s why I originally thought it was a defective GPU . I saw other people reporting similar issues that have been resolved by simply changing this setting. I have been almost a month crash free.

意訳:RTX20系のカードをCore X Chromaで使用しているとNvidiaコントロールパネルの電源管理モードを「パフォーマンス最大化を優先」に設定しないとシステムがクラッシュします。

RTX20シリーズ特有の問題らしい。Nvidiaコントロールパネルとはこのアプリのことだ。

電源管理モードが当初「適応」に設定されていた。

これを「パフォーマンス最大化を優先」に設定、念の為再起動しておく。

これ以降クラッシュは一度も起きていない。

まさか電源管理モードだったとは。eGPUは電源が確保できる環境なのだからおせっかいは正直いらない。

この解決策を投稿したMaxRD兄貴によると、ドライバのアップデートごとに設定をしないといけないらしい。なにかの表紙で最新版にアップデートされた際に電源管理モードがリセットされた可能性がある。