Anzeige

Am Puls von Microsoft

Anzeige

Frage BSOD ohne Ursache? (nvlddmkm.sys) VIDEO TDR FAILURE

padrino

Herzlich willkommen
Hallo liebes Forum,

nachdem ich so langsam am Verzweifeln bin seit ihr meine letzte Hoffnung.

Im November hatte ich viele überaschende Abstürze ohne Bluescreen die erst nach einer Neuinstallation aufhörten.

Seit ein paar Tagen sind sie leider zurück, allerdings mit Bluescreens, ohne dass am Rechner etwas verändert worden wäre.
Sowohl im Spiel (Baldurs Gate 3) als auch im Desktop, bzw. Textverarbeitung oder Browser ist es schon aufgetreten.
Ohne erkennbaren Grund oder Vorwarnung erscheint dann der Bluescreen und der PC startet neu. (Der Bluescreen erscheint nur auf Windowsoberfläche, im Spiel friert das Bild einfach ein. Ich gehe davon aus, dass der Bluescreen im Hitergrund erscheint, da der Rechner nach kurzer ZEit selbst neu startet.)

Der angebene Stillstandcode ist dabei immer der gleich: VIDEO TDR FAILURE und die Ursache: nvlddmkm.sys

Bei der Suche nach nvlddmkm.sys habe ich vor allem Fehler in Zusammenhang mit Grafikkarte/Treiber gefunden, daher habe ich bis jetzt auch vor allem versucht in dieser Richtung Fehler zu beseitigen.

Die Graka-Treiber habe ich mit DDU im abgesicherten Modus deinstalliert und die aktuellsten Treiber neu installiert.

Heute liefen 3dMark und PCMark ohne Fehler durch, Abstürze hatte ich heute bis jetzt auch keine (in windows).

Die HWinfo und die Minidumps habe ich als Dateien angehängt.

Meine Hardware ist nicht mehr neu, hat aber bisher tadellos funktioniert und wurde in letzter Zeit nicht verändert:

Intel i7 7700k
Asus Z170 Pro Gaming
Asus ROG Strix GTX 1080
RAM Corsair 16GB
Boot Drive: Samsung SSD 950 Pro 512GB
Netzteil: bequiet straight Power 10 500W
CPU-Kühler: Thermalright Macho RevB
Gehäuse: Fractal Design Define R6 mit je einem 120mm Lüfter vorn und hinten

Ich hoffe ihr könnt mir weiterhelfen!
 

Anhänge

  • HWinfo.png
    HWinfo.png
    185,1 KB · Aufrufe: 47
  • minidump1.zip
    904,8 KB · Aufrufe: 21
  • minidump2.zip
    974,1 KB · Aufrufe: 22
Anzeige
Hallo @padrino! Willkommen im Forum! 🙋‍♂️
In allen 5 Dumpfiles war der gleiche Fehler protokolliert:
VIDEO_TDR_FAILURE (116)
Dabei war bei allen Dumpfiles der Parameter 3 = Arg3: ffffffffc000009a
Das ist NTStatus 0xC000009A STATUS_INSUFFICIENT_RESOURCES und bedeutet
Insufficient system resources exist to complete the API.
Also es sind nicht genügend Systemressourcen vorhanden um die API zu laden.

Bitte kontrolliere, ob an die Grafikkarte 2Stecker angesteckt sind. Wenn ja, dann sollte jeder Stecker ein eigenes Zuleitungskabel haben, also keine Abzweigungen.
Auf der Homepage gibt es eine Tabelle mit empfohlen PSU (Netzteil-Größen). Leider ist die eingebaute Grafikkarte nicht dabei.
Mir erscheint das Netzteil etwas schwach.
Das BIOS ist aktuell, es gibt kein neueres BIOS.

Nachtrag:
Das Symbol dxgkrnl!_TDR_RECOVERY_CONTEXT wurde leider in keiner der Dumpfiles gespeichert, sodass man den Stoppfehler nicht näher untersuchen kann.

Nicht zuletzt sollte der Memory mit Memtest überprüft werden.
Die Free-Version reicht (weißer Download-Button) .
 
Zuletzt bearbeitet:
Bei der Suche nach nvlddmkm.sys habe ich vor allem Fehler in Zusammenhang mit Grafikkarte/Treiber gefunden

stimmt, das ist der Nvidia Treiber

Die Graka-Treiber habe ich mit DDU im abgesicherten Modus deinstalliert und die aktuellsten Treiber neu installiert.

das solltest du lassen, DDU ist nicht selten übereifrig und entfernt dabei Treiberbereiche wie Chipsatz etc. gleich mit, das sollte man vorher schon ganz genau einstellen

Heute liefen 3dMark und PCMark ohne Fehler durch, Abstürze hatte ich heute bis jetzt auch keine (in windows).

nichts fordert ein System mehr als Lastwechsel in Games, da sind stringente linear arbeitende Belastungstools ungeeignet, weil sie weder Lastwechsel oder Lastspitzen simulieren können und noch weniger systembasierte Workloads...

was sind Lastspitzen: Der Kampf von Grafikkarte gegen Netzteil - Leistungsaufnahme und Lastspitzen entmystifiziert | igorsLAB | Seite 2 | igor´sLAB

darum vermute ich aus der Ferne dein jetziges Netzteil als den ausschlaggebenden Schwachpunkt, zumal das Netzteil 10 Jahre alt wird und man inzwischen mit ausgelaufenen oder entladenen Elkos rechnen muss
 
Vielen Dank schon einmal für die Analyse der Files und die Tipps.

Ich habe gerade mal die Stromanschlüsse überprüft. Beide Kabel stecken sicher und es sind auch zwei getrennte Kabel.
Den Sitz der Karte auf dem Board habe ich auch nochmal gecheckt.

Der Verdacht aufs Netzgerät ist alleine vom Alter her vermutlich nicht ganz von der Hand zu weisen.
Das Einzige was mich irritiert ist, dass der Rechner auch bei normalen Office Anwendungen abstürzt und nicht nur im Spiel.
Da dürften doch eigentlich keine solche Lastspitzen auftreten, oder?
Das Symbol dxgkrnl!_TDR_RECOVERY_CONTEXT wurde leider in keiner der Dumpfiles gespeichert, sodass man den Stoppfehler nicht näher untersuchen kann.
Gibt es eine Möglichkeit das einzustellen? Also das mehr Informationen in die Dumpfiles kommen falls er wieder abstürzt? Habe mich bis heute nie mit diesen Files befasst.

Memtest hatte ich im November über Stunden ohne Fehler laufen. Werde ich heute Nacht mal nochmal anwerfen.
nichts fordert ein System mehr als Lastwechsel in Games, da sind stringente linear arbeitende Belastungstools ungeeignet, weil sie weder Lastwechsel oder Lastspitzen simulieren können und noch weniger systembasierte Workloads...
Gibt es denn ein Tool das die Grafikkarte in der Hinsicht mehr fordert? Furmark o.ä.?
Oder eine andere Möglichkeit das Netzteil zu testen?
 
Leider ist es so, dass dieses Symbol und einige andere bei anderen BSODs in den Minidumpfiles meist nicht mit gespeichert wird. Da kann man auch nichts einstellen. Manchmal wird ein volles Speicherabbild in C:\Windows\Memory.dmp gespeichert. Da werden mehr Informationen gespeichert. Aber Windows entscheidet selbst ob volles Abbild oder nur Minidump oder beides gespeichert werden.
 
Gibt es denn ein Tool das die Grafikkarte in der Hinsicht mehr fordert? Furmark o.ä.?
Oder eine andere Möglichkeit das Netzteil zu testen?

zweimal nein, das ist nur mir professionellem Testequipment zu prüfen

Da dürften doch eigentlich keine solche Lastspitzen auftreten, oder?

kommt drauf an, was bei dir auf dem System für Tools installiert sind

Tools wie den Ccleaner ->Glary Utilities, Tuneup, IoBIT o.ä. Systemstabilitäts-Vernichter zu verwenden (auchnicht AMDs Ryzen Master, Asus Aura, Asus Armoury Crate, Asus AI Suite, Asus Probe oder MSI Center, MSI Dragon Center oder Samsung Magician o.ä.), da diese sich diese Tools tief ins System graben und den System BUS erheblich belasten können

darum empfehle ich solche Tools wenn überhaupt nur in ihrer portablen Version zu nutzen, die eben nicht installiert werden

und was den Nvidia Treiber angeht, lass die Rubrik Geforce Experience in Zulunft weg, der geht auch in diese Richtung
 
Das ich für Geforce Experience gerügt werde hatte ich mir schon gedacht ;)
Bin mir nichtmal sicher warum ich es diesmal mit installiert hatte.

Habe heute Abend mit einem Freund ein paar Spiele getestet und wirklich versucht die Abstürze zu reproduzieren.
Ohne Erfolg. Der Rechner lief den ganzen Tag fehlerlos.

Können die Abstürze aus Windows heraus auch am Netzteil liegen?

Sollte der Rechner nicht wirklich wundersam geheilt sein habe ich außer dem Netzteiltausch erstmal keine andere Optionen, oder?
 
Ich gebe mal noch ein kurzer Update.
Memtest lief ohne Fehler durch.
Der Rechner ist seit letzter Woche nicht mehr abgestürzt obwohl ich abgesehen vom Grafikkarten Aus- und Wiedereinbau nichts verändert habe.
Auch Spiele laufen im Moment stabil. Habe extra auch ein paar getestet die die Grafikkarte etwas mehr fordern.
nichts fordert ein System mehr als Lastwechsel in Games
Trotzdem misstraue ich dem Netzteil durch eure Analyse etwas.
Einzige Unklarheit für mich ist noch, warum die Abstürze auch im Browser bzw. Bei Office-Anwendungen auftraten. Da sollten ja keine Lastspitzen oder ähnliches auftreten.

Da im Moment scheinbar keine Probleme auftreten ist eine weitere Analyse vermutlich schwierig, oder habt ihr mir Noch einen Tipp um mögliche Fehler zu finden?
 
Anzeige
Oben