Anzeige

Am Puls von Microsoft

Anzeige

[gelöst] Win10 friert ein: VIDEO_TDR_ERROR, viele GPU-Treiber ausprobiert, Fehlerquelle=?

Vertical-Expo

bekommt Übersicht
Hallo liebe Foren-Community,

ich habe einen alten Rechner der jüngst (bzw. sehr spät :D) auf Win10 upgegraded wurde. Seit dem Update auf Windows 10 (build: 18363) hängt sich aber leider öfters der Rechner auf (wahlweise schwarzer Bildschirm oder selten auch Blue Screen). Genau genommen scheint eine Bildschirmaktualisierung zu scheitern (VIDEO_TDR_ERROR).

Rechner:
  • CPU: Intel Core i5 3350P 4x 3.10GHz So.1155, CPU Kühler: Intel CPU-Kühler E97378-001
  • Mainboard: ASRock H77 Pro4/MVP Intel H77 So.1155 Dual Channel DDR3 ATX
  • GPU: 2048MB Gigabyte GeForce GTX 660 OC 2xWindforce Aktiv PCIe 3.0 x16
  • RAM: 8GB Corsair Vengeance LP Blue DDR3-1600 DIMM CL9 Dual Kit
  • Netzteil: 430 Watt be quiet! Pure Power CM Modular 80+ Bronze
  • HDD: 1000GB Seagate Barracuda 7200.14 ST1000DM003 64MB 3.5" (8.9cm) SATA 6Gb/s
  • Gehäuse: BitFenix Shinobi USB 3.0 Midi Tower mit 1x 120mm Lüfter wie ausgeliefert, keine weiteren verbauten Lüfter (theoretisch möglich: 1x 92mm, 2x 140mm, 5x 120mm)
Nachfolgend alle Infos und Dumps. Laut Dump kommt das Problem von der nvlddmkm.sys (0xFFFFF80325DAB668),
Bugcheck code: 0x116 (0xFFFFC283B76B1460, 0xFFFFF80325DAB668, 0x0, 0xD), Error: VIDEO_TDR_ERROR.

Von mir recherchierte Details zu VIDEO_TDR_ERROR: Ein häufiges Stabilitätsproblem bei Grafiken tritt auf, wenn das System während der Verarbeitung eines Endbenutzerbefehls oder einer Endbenutzerbefehls oder einer Endbenutzerbefehlsoperation vollständig eingefroren oder hängen bleibt. Normalerweise ist die GPU mit der Verarbeitung intensiver Grafikoperationen beschäftigt, normalerweise während des Spiels. Es werden keine Bildschirmaktualisierungen durchgeführt, und Benutzer gehen davon aus, dass ihr System eingefroren ist. Normalerweise warten Benutzer einige Sekunden und starten dann das System durch Drücken des Netzschalters neu. Windows versucht, diese problematischen Hangsituationen zu erkennen und einen reaktionsfähigen Desktop dynamisch wiederherzustellen. Dieser Prozess der Erkennung und Wiederherstellung wird als Timeout-Erkennung und Wiederherstellung (Timeout Detection and Recovery, TDR) bezeichnet. Das Standardzeitlimit beträgt 2 Sekunden. Im TDR-Prozess für Grafikkarten ruft der GPU-Scheduler des Betriebssystems die Funktion DxgkDdiResetFromTimeout des Display-Miniport-Treibers auf, um den Treiber neu zu initialisieren und die GPU zurückzusetzen. Während dieses Vorgangs weist das Betriebssystem den Treiber an, nicht auf die Hardware oder den Arbeitsspeicher zuzugreifen, und gibt ihm eine kurze Zeit, um aktuell ausgeführte Threads abzuschließen. Wenn die Threads nicht innerhalb des Timeouts abgeschlossen sind, prüft der Systemfehler mit 0x116 VIDEO_TDR_FAILURE. Weitere Informationen finden Sie unter Thread-Synchronisierung und TDR. Das System kann mit VIDEO_TDR_FAILURE auch Fehler überprüfen, wenn eine Reihe von TDR-Ereignissen in kurzer Zeit auftreten, standardmäßig mehr als fünf TDRs in einer Minute. Wenn der Wiederherstellungsprozess erfolgreich ist, wird eine Meldung angezeigt, die angibt, dass der Anzeigetreiber nicht mehr reagiert und wiederhergestellt wurde. Weitere Informationen finden Sie unter Erkennung und Wiederherstellung von Zeitüberschreitungen (Timeout Detection and Recovery, TDR), TDR-Registrierungsschlüssel und TDR-Änderungen in Windows 8, die unter Tipps zum Debuggen für das Windows-Bildschirmtreibermodell (WDDM) aufgeführt sind.

Anzumerken wäre, dass das Einfrieren/Fehlschlagen der Bildschirmaktualisierung völlig wahllos passiert: Normaler Windowsbetrieb ohne Verarbeitung intensiver Grafikoperationen - mal direkt nach Start, mal nach einer Stunde etc. Einen Zusammenhang mit einer bestimmten Operation (grafikintensives Spiel etc.) habe ich nicht feststellenkönnen.

Ich habe nun bereits in NVIDIA Foren recherhiert und mehrere GPU Treiber ausprobiert (jeweils installiert und bis zum nächsten Einfrieren gewartet). Aktuell bin ich bei der neusten Version angelangt (siehe HWInfo Screenshot), die das Problem allerdings auch nicht löst.

Übersehe ich etwas? Eventuell doch Hardware? Überhitzung? RAM? Weiter zu Treibern/nvlddmkm.sys recherchieren?

Im Zuge des Upgrades auf Win10 habe ich übrigens auch die Bios Firmware auf die "neuste" von 2013 aktualisiert.

Das System ist wie gesagt noch recht frisch. Hatte daher auch bereits eine Neuinstallation in Erwägung gezogen - sofern das helfen würde?

Wäre über jede Analyse und Ideen dankbar.

Danke und viele Grüße!
 

Anhänge

  • hwinfo-werte.jpg
    hwinfo-werte.jpg
    680,9 KB · Aufrufe: 63
  • minidumps.zip
    919,6 KB · Aufrufe: 42
Zuletzt bearbeitet:
Anzeige
STACK_TEXT:
fffffe00`29d09808 fffff803`0e03ecea : 00000000`00000116 ffffc107`be4da010 fffff803`1211b668 00000000`00000000 : 0xfffff803`0a1c23c0
fffffe00`29d09810 00000000`00000116 : ffffc107`be4da010 fffff803`1211b668 00000000`00000000 00000000`0000000d : 0xfffff803`0e03ecea
fffffe00`29d09818 ffffc107`be4da010 : fffff803`1211b668 00000000`00000000 00000000`0000000d ffffc107`b9cf4964 : 0x116
fffffe00`29d09820 fffff803`1211b668 : 00000000`00000000 00000000`0000000d ffffc107`b9cf4964 00000000`00000000 : 0xffffc107`be4da010
fffffe00`29d09828 00000000`00000000 : 00000000`0000000d ffffc107`b9cf4964 00000000`00000000 fffff803`0e03e35b : 0xfffff803`1211b668


SYMBOL_NAME: ANALYSIS_INCONCLUSIVE

MODULE_NAME: Unknown_Module

IMAGE_NAME: Unknown_Image

STACK_COMMAND: .thread ; .cxr ; kb

FAILURE_BUCKET_ID: 0x116_ANALYSIS_INCONCLUSIVE!unknown_function
OSPLATFORM_TYPE: x64
Die Dumpfile lässt sich nicht richtig auswerten. So wie es aussieht hängt der Fehler mit der Grafikkarte zusammen?
Unloaded modules:
fffff803`077b0000 fffff803`077bf000 hiber_storpo
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000F000
fffff803`077c0000 fffff803`077ef000 hiber_storah
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0002F000
fffff803`077f0000 fffff803`0780e000 hiber_dumpfv
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`076e0000 fffff803`076f4000 ′潈敭潂⁸㘶ㄴ䈐܀㘹㘳
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00014000
fffff803`07650000 fffff803`07661000 ᆢ轵劤ǖ始澈�ǔ 
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00011000
fffff803`07790000 fffff803`077ac000 Unknown_Module_fffff803`07790000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07770000 fffff803`0778c000 Unknown_Module_fffff803`07770000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07750000 fffff803`0776c000 ﲺ镎㟤缂០⭓଀(
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07730000 fffff803`0774c000 Unknown_Module_fffff803`07730000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07680000 fffff803`0768f000 hiber_storpo
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000F000
fffff803`07690000 fffff803`076bf000 hiber_storah
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0002F000
fffff803`076c0000 fffff803`076de000 hiber_dumpfv
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`07610000 fffff803`07624000 $DSC
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00014000
fffff803`0eb80000 fffff803`0eba6000 ޠ⣡줌￿
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00026000
fffff803`07630000 fffff803`0763e000 Unknown_Module_fffff803`07630000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000E000
fffff803`07a10000 fffff803`07a1e000 i
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000E000
fffff803`0ebf0000 fffff803`0ec0c000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0ebd0000 fffff803`0ebec000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0ebb0000 fffff803`0ebcc000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0cc20000 fffff803`0cc3c000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0e460000 fffff803`0e46f000 dump_storpor
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000F000
fffff803`0e4a0000 fffff803`0e4cf000 dump_storahc
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0002F000
fffff803`0e4f0000 fffff803`0e50e000 dump_dumpfve
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`0e670000 fffff803`0e68e000 Unknown_Module_fffff803`0e670000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`0c7d0000 fffff803`0c7e1000 WdBoot.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00011000
fffff803`0d7c0000 fffff803`0d7d1000 hwpolicy.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00011000
Was hast Du da denn auf Deinem Rechner? Koreanische Zeichen
 
Übersehe ich etwas? Eventuell doch Hardware? Überhitzung?

schon möglich, aber wer soll das ohne Daten beurteilen?

also liste bitte auch den CPU Kühler, das PC Gehäuse samt Lüfter und auch das Netzteil auf, damit hier keiner raten muß
 
Vielen Dank für den Hinweis zu den Kühlern. Habe die Infos noch oben ergänzt:

  • CPU: Intel Core i5 3350P 4x 3.10GHz So.1155, CPU Kühler: Intel CPU-Kühler E97378-001
  • Mainboard: ASRock H77 Pro4/MVP Intel H77 So.1155 Dual Channel DDR3 ATX
  • GPU: 2048MB Gigabyte GeForce GTX 660 OC 2xWindforce Aktiv PCIe 3.0 x16
  • RAM: 8GB Corsair Vengeance LP Blue DDR3-1600 DIMM CL9 Dual Kit
  • Netzteil: 430 Watt be quiet! Pure Power CM Modular 80+ Bronze
  • HDD: 1000GB Seagate Barracuda 7200.14 ST1000DM003 64MB 3.5" (8.9cm) SATA 6Gb/s
  • Gehäuse: BitFenix Shinobi USB 3.0 Midi Tower mit 1x 120mm Lüfter wie ausgeliefert, keine weiteren verbauten Lüfter (theoretisch möglich: 1x 92mm, 2x 140mm, 5x 120mm)
Hoffe das hilft. Mit Win 7 ist das System übrigens Jahre stabil ohne derartige Probleme gelaufen. Insofern ging meine erste Vermutung auch eher Richtung Treiber/entsprechend der TDR-Fehlermeldung.

STACK_TEXT:
fffffe00`29d09808 fffff803`0e03ecea : 00000000`00000116 ffffc107`be4da010 fffff803`1211b668 00000000`00000000 : 0xfffff803`0a1c23c0
fffffe00`29d09810 00000000`00000116 : ffffc107`be4da010 fffff803`1211b668 00000000`00000000 00000000`0000000d : 0xfffff803`0e03ecea
fffffe00`29d09818 ffffc107`be4da010 : fffff803`1211b668 00000000`00000000 00000000`0000000d ffffc107`b9cf4964 : 0x116
fffffe00`29d09820 fffff803`1211b668 : 00000000`00000000 00000000`0000000d ffffc107`b9cf4964 00000000`00000000 : 0xffffc107`be4da010
fffffe00`29d09828 00000000`00000000 : 00000000`0000000d ffffc107`b9cf4964 00000000`00000000 fffff803`0e03e35b : 0xfffff803`1211b668


SYMBOL_NAME: ANALYSIS_INCONCLUSIVE

MODULE_NAME: Unknown_Module

IMAGE_NAME: Unknown_Image

STACK_COMMAND: .thread ; .cxr ; kb

FAILURE_BUCKET_ID: 0x116_ANALYSIS_INCONCLUSIVE!unknown_function
OSPLATFORM_TYPE: x64
Die Dumpfile lässt sich nicht richtig auswerten. So wie es aussieht hängt der Fehler mit der Grafikkarte zusammen?
Unloaded modules:
fffff803`077b0000 fffff803`077bf000 hiber_storpo
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000F000
fffff803`077c0000 fffff803`077ef000 hiber_storah
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0002F000
fffff803`077f0000 fffff803`0780e000 hiber_dumpfv
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`076e0000 fffff803`076f4000 ′潈敭潂⁸㘶ㄴ䈐܀㘹㘳
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00014000
fffff803`07650000 fffff803`07661000 ᆢ轵劤ǖ始澈�ǔ
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00011000
fffff803`07790000 fffff803`077ac000 Unknown_Module_fffff803`07790000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07770000 fffff803`0778c000 Unknown_Module_fffff803`07770000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07750000 fffff803`0776c000 ﲺ镎㟤缂០⭓଀(
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07730000 fffff803`0774c000 Unknown_Module_fffff803`07730000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`07680000 fffff803`0768f000 hiber_storpo
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000F000
fffff803`07690000 fffff803`076bf000 hiber_storah
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0002F000
fffff803`076c0000 fffff803`076de000 hiber_dumpfv
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`07610000 fffff803`07624000 $DSC
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00014000
fffff803`0eb80000 fffff803`0eba6000 ޠ⣡줌￿
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00026000
fffff803`07630000 fffff803`0763e000 Unknown_Module_fffff803`07630000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000E000
fffff803`07a10000 fffff803`07a1e000 i
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000E000
fffff803`0ebf0000 fffff803`0ec0c000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0ebd0000 fffff803`0ebec000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0ebb0000 fffff803`0ebcc000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0cc20000 fffff803`0cc3c000 EhStorClass.
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001C000
fffff803`0e460000 fffff803`0e46f000 dump_storpor
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000F000
fffff803`0e4a0000 fffff803`0e4cf000 dump_storahc
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0002F000
fffff803`0e4f0000 fffff803`0e50e000 dump_dumpfve
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`0e670000 fffff803`0e68e000 Unknown_Module_fffff803`0e670000
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0001E000
fffff803`0c7d0000 fffff803`0c7e1000 WdBoot.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00011000
fffff803`0d7c0000 fffff803`0d7d1000 hwpolicy.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 00011000
Was hast Du da denn auf Deinem Rechner? Koreanische Zeichen

Ich habe die Dumpfiles mit "WhoCrashed" ausgewertet - das ging soweit. Und zu den koreanischen Zeichen: Keine Ahnung :D Wie gesagt, es ist eine recht frische Installation mit Standard-Konfiguration und ein paar wenigen Programmen zusätzlich installiert. Schriftarten/Zeichen können ggf. via einer Office-Version kommen?

Dass der Fehler evtl. von der Grafikkarte kommt habe ich auch soweit lokalisiert - daher auch meine Tests mit mehreren Treiberaktualisierungen (siehe Aussgangsposting).

Falls ihr weitere Infos braucht, gerne melden. Ich bin leider kein Experte auf dem Thema, liefere aber gerne zu und recherchiere selbst.
 
Wo hast du die Treiber geholt?
 
Zuletzt bearbeitet:
Hallo @vert1go! Willkommen im Forum! :)
Die Dumpfile 073120-26781-01.dmp und 073020-24609-01.dmp sind für die Auswertung mit dem Debugger unbrauchbar, weil die Modullisten fehlen. Dadurch kann nur mit Adressen gearbeitet werden, was unbrauchbar ist.
VIDEO_TDR_FAILURE (116)
Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: ffffc107be4da010, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff8031211b668, The pointer into responsible device driver module (e.g. owner tag).
Arg3: 0000000000000000, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 000000000000000d, Optional internal context dependent data.

Debugging Details:
------------------

***** Debugger could not find nt in module list, module list might be corrupt, error 0x80070057.
....
FAILURE_BUCKET_ID: 0x116_ANALYSIS_INCONCLUSIVE!unknown_function
Darüber hinaus weisen 5 Dumpfiles den gleichen Fehler auf
VIDEO_TDR_FAILURE (116)
Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: ffffd7051725f460, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff8036a0eb668, The pointer into responsible device driver module (e.g. owner tag).
Arg3: 0000000000000000, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 000000000000000d, Optional internal context dependent data.

Debugging Details:
------------------

Unable to load image \SystemRoot\System32\DriverStore\FileRepository\nv_dispi.inf_amd64_edab19158bdd0d0a\nvlddmkm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for nvlddmkm.sys
*** WARNING: Unable to verify timestamp for win32k.sys
....
FAILURE_BUCKET_ID: 0x116_IMAGE_nvlddmkm.sys
Diese Aussagen sind im Prinzip in allen drei Dumpfiles vom 14.07. und 15.07. 2020 gleich.
Vor allem der erste Satz nach "Debugging Details" ist aufschlussreich.
Das Image von nvlddmkm.sys konnte nicht richtig geladen werden. Und wie es aussieht, ist die INF-Datei, die die Treiberinformationen enthält, schon fehlerhaft.
Da stellt sich die Frage, woher die Treiber sind und ob ein Driver-Booster oder anderes Treibersuchprogramm benutzt wurde.
 
der Intel CPU-Kühler E97378-001 also, das hatte ich befürchtet, der boxed Kühler ist auf Grund seiner geringen Kühlleistung schnell überfordert, vor allem in Umgebungen ohne Airflow und dank des BitFenix Shinobi nur mit Hecklüfter ist definitiv kein Airflow vorhanden

das wäre ein funktionierender Airflow: airflow.jpg

der Corsair RAM steht nicht in der QVL vom Asrock Mainboard, das kann trotzdem funktionieren, muß es aber nicht und schon gar nicht auf Dauer

ich würde erst mal schauen ob die wenigen vorhandenen Lüfter sauber sind und überhaupt noch drehen, darüber hinaus wäre die Erneuerung der Wärmeleitpaste für CPU und GPU anzuraten
 
Vielen Dank für Eure Einschätzungen!

Wo hast du die Treiber geholt, hast du dazu ein Tool benutzt?

Hallo @vert1go! Willkommen im Forum! :)
(...)
Diese Aussagen sind im Prinzip in allen drei Dumpfiles vom 14.07. und 15.07. 2020 gleich.
Vor allem der erste Satz nach "Debugging Details" ist aufschlussreich.
Das Image von nvlddmkm.sys konnte nicht richtig geladen werden. Und wie es aussieht, ist die INF-Datei, die die Treiberinformationen enthält, schon fehlerhaft.
Da stellt sich die Frage, woher die Treiber sind und ob ein Driver-Booster oder anderes Treibersuchprogramm benutzt wurde.

Die Treiber wurden immer direkt über NVIDIA oder deren Software-Pakete (GeForce Experience) bezogen. Kein Treibersuchprogramm wurde genutzt.

Dank auch @Mark O. Den Airflow kann ich gerne optimieren und z.B. zusätzliche Lüfter einbauen. Soweit arbeiten alle und die Wärmeleitpaste habe ich im letzten Jahr erneuert. GPU wäre in der Tat eine Option.

Wenn ich das zusammenfasse, dann haben wir drei Ansatzpunkte:
1. INF-Datei, die die Treiberinformationen enthält, ist fehlerhaft durch fehlerhafte Treiberinstallation (?)
2. Kein ausreichender Airflow durch Staub/zu wenig Lüfter/alte Wärmeleitpaste/zu schlechter Boxed CPU Kühler = Überhitzung Komponenten
3. RAM Inkompatibilität mit Mainboard

Zu meinem Verständnis: Könnte man die zwei letzten Punkte nicht durch Fehlermeldungen/Logs/Temperaturmessungen o.ä. ausschließen? Anzumerken sei noch, dass der Rechner auch z.B. direkt nach dem Start einfriert, was meiner Meinung gegen Überhitzung sprechen würde. Die 1. Variante klingt für mich so, als könnte ich die Treiberproblematik (falls sie denn der Auslöser ist) auch durch einen cleanen neuen Reinstall beheben? Wobei die Problematik ja in erster Instanz nach einem selbigen aufgetreten ist...

Ich würde jetzt die Punkte nacheinander abarbeiten startend mit Airflow (sowieso sinnvoll). Wie ich 1. adressiere ist mir nicht klar. Und 3. auf Verdacht RAM tauschen wäre für mich die letzte Option.

Soweit sinnvoll oder andere Tipps/Anmerkungen?
 
Nach der Dumpfile liegt der Fehler bei der Grafikkarte (VIDEO_TDR_ERROR).
TDR ist die Taktdatenrückgewinnung.
Dein Motherboard hat einen Anschluss für den Bildschirm.
Baue mal die Grafikkarte aus. Den Monitor am Motherboard anschließen und schauen ob der Stopp Fehler weg ist?
 
Joo, wenn der Prozessor kein Grafikkarte hat geht das nicht. Dann müsste man zum Testen eine andere Grafikkarte einbauen.
 
Entschuldige bitte @SilverServer, wenn ich dir hier mal widerspreche:
TDR ist nicht Taktdatenrückgewinnung sondern
TDR = TimeoutDetectionAnd Recovery
Also das Erkennen einer Zeitüberschreitung und die Wiederherstellung des Treibers.
Zitat von der Seite docs.microsoft.com
(Bug Check 0x116 VIDEO_TDR_FAILURE - Windows drivers | Microsoft Docs)
This process of detection and recovery is known as Timeout Detection and Recovery (TDR). The default timeout is 2 seconds. In the TDR process for video cards, the operating system's GPU scheduler calls the display miniport driver's DxgkDdiResetFromTimeout function to reinitialize the driver and reset the GPU.
Das maximale Timeout ist auf 2 Sekunden festgelegt. Wenn sich der Treiber in dieser Zeit nicht reaktivieren lässt, wird ein TDR-Error generiert.
Im Normalfall dauert dieses Reaktivieren nur einige hundertstel Sekunden und man sieht höchstens ein leichtes Flackern.
 
BitFenix Shinobi nur mit Hecklüfter ist definitiv kein Airflow vorhanden

Korrigier dich mal in einem Shinobi ist NIE Airflow vorhanden außer du bist von Haus aus Taub deine nächsten Nachbarn 2 km entfernt und du kleisterst 10.000 rpm Industrielüfter rein. Max zulässige tCase von der Fuhre sind übrigens zarte 67,4 die dürfte der aber nicht mal annähernd erreichen bei der geringen Voltage
 
Jut, ich fasse nochmal zusammen: Wir haben geklärt, was TDR bedeutet. Wir haben geklärt, dass meine CPU keine interne Grafikeinheit hat und ich daher nicht testen kann, was ohne die GeForce GTX 660 passiert (eine zweite Grafikkarte habe ich hier nicht). Wir haben auch eine Vermutung in die Richtung, dass es keine CPU Überhitzung aufgrund meiner geringen Voltage ist. Zur möglichen RAM-Inkompatibilität finden sich keine weiteren Stimmen.

Wie geht es jetzt weiter? Fokussieren auf die Grafikkartentreiber scheint am sinnvollsten. Mein Ziel ist es, den Rechner zu betreiben, ohne dass er unkalkulierbar abrauscht. Bisher fehlt mir noch ein konkreter Lösungsvorschlag für den TDR Error. Wie geschrieben, zweite GraKa habe ich nicht. Wenn ich aktuell den neusten Treiber verwende und der korrekt über die GeForce Software installiert wurde, was wären noch Lösungsmöglichkeiten? Auch wenn niemand bisher darauf geantwortet hat, mir scheint eine Neuinstallation vll. noch am erfolgversprechensten? :D

In Sachen Hardeware/Airflow kaufe ich einfach mal 3 weitere Lüftern (zwei in die Front einströmend, einer zusätzlich hinten raus in Ergänzung zum 120er). Auch wenn es das nicht sein mag, der Punkt ist schon valide, das bisschen Basteln macht Spass und das Gehäuse kann ich ja auch noch bei einer Aufrüstung verwenden. Eine Alternative zum boxed CPU Kühler wie z.B. den Noctua NH-L9i o.ä. würde ich mir für den Moment glaube ich eher sparen, es sei denn, jemand hat noch einen günstigen Tipp? In dem Zusammenhang nicht vergessen: Die Kiste ist 7 Jahre alt!
 
Wenn mein Rechner Fehler zeigt mache ich immer am Anfang der Fehlersuche eine Neuinstallation. So kann man weitgehend Software Fehler ausschließen. Es gibt aber viele User die wollen keine Neuinstallation machen.

Was die Grafikkarte betrifft so kannst Du den Treiber neu installieren.
Auch andere, ältere Treiber versuchen.
Wenn immer noch dieser blue screen auftritt bleibt nur eine andere Grafikkarte zu versuchen.

Was den Airflow betrifft, wie warm werden den CPU und GPU nach längerem Betrieb? Wenn die nicht zu warm werden würde ich dies erst mal nicht weiter verfolgen.
 
Zur möglichen RAM-Inkompatibilität finden sich keine weiteren Stimmen.

dafür brauchen wir keine weiteren Stimmen, das ist einfach mal Fakt

wenn es solange gut ging, hast du einfach nur Glück gehabt, auch so etwas gibt es in der IT, wenn auch selten


was ich tun würde:

1. eine Reinigung des Gehäuses und der Lüfter, dazu die Erneuerung der WLP für CPU und GPU, das alles kostet außer Zeit erst mal nichts

2. wenn du gerade erst neu installiert hast, sehe ich keinen plausiblen Grund dafür, schon wieder zu installieren

3. den Nvidia Treiber würde ich mit DDU komplett rausschmeißen und dann bei Installation darauf achten, das du das Geforce Experience Gerümpel ausklammerst, das ist so ziemlich die übelste Ecke der Nvidia Treiber

4. investieren kannst du dann immer noch, aber ganz sicher nicht in einen Noctua NH-L9i, sondern eher in einen Kühler, der seine Abwärme in Richtung des Gehäuse Hecklüfters transportiert und der im Vergleich auch kühlt: DeepCool Gammaxx 300 ab €' '19,37 (2020) | Preisvergleich Geizhals Deutschland

davon abgesehen könntest du das System auch ohne Ersatzteile zumindest ansatzweise prüfen, in dem du es von einem Linux Live System laufen läßt

zu empfehlen:

Knoppix Live System

Ubuntu Live USB-Stick

- sollte sich auf dem Live System kein Fehler mehr zeigen, liegt es definitiv nicht an der Hardware, sondern an Windows
 
Was die Grafikkarte betrifft so kannst Du den Treiber neu installieren. Auch andere, ältere Treiber versuchen.
Exakt so bin ich bisher vorgegangen.

dafür brauchen wir keine weiteren Stimmen, das ist einfach mal Fakt. wenn es solange gut ging, hast du einfach nur Glück gehabt, auch so etwas gibt es in der IT, wenn auch selten
Hier haben wir uns mißverstanden. Ich meinte, es gab keine weiteren Stimmen, die die Inkompatibilität als Ursache des TDR-Errors ausgemacht haben.

1. eine Reinigung des Gehäuses und der Lüfter, dazu die Erneuerung der WLP für CPU und GPU, das alles kostet außer Zeit erst mal nichts
Sehe ich auch so. Wird gemacht.

2. wenn du gerade erst neu installiert hast, sehe ich keinen plausiblen Grund dafür, schon wieder zu installieren
Das war vor einigen Monaten (Umstellung Win 10). Da ich aber nicht 100% nachvollziehen kann, welche GPU Treiber wann wie installiert/de-installiert habe etc. schien mir ein Reinstall einfach als saubere Variante.

3. den Nvidia Treiber würde ich mit DDU komplett rausschmeißen und dann bei Installation darauf achten, das du das Geforce Experience Gerümpel ausklammerst, das ist so ziemlich die übelste Ecke der Nvidia Treiber
Hast Du eine Empfehlung für eine "bessere Ecke" der Nvidia Treiber? Ich bin davon ausgegangen, dass wenn ich deren Boardmittel/Software verwende und die neuste Treibergeneration, ich gut aufgestellt sei. Dem ist scheinbar nicht so?

4. investieren kannst du dann immer noch, aber ganz sicher nicht in einen Noctua NH-L9i, sondern eher in einen Kühler, der seine Abwärme in Richtung des Gehäuse Hecklüfters transportiert und der im Vergleich auch kühlt: DeepCool Gammaxx 300 ab €' '19,37 (2020) | Preisvergleich Geizhals Deutschland
Danke für den Tipp. Ggf. baue ich den DeepCool auch einfach mit ein.
 
Guten Morgen! :)
3. den Nvidia Treiber würde ich mit DDU komplett rausschmeißen und dann bei Installation darauf achten, das du das Geforce Experience Gerümpel ausklammerst, das ist so ziemlich die übelste Ecke der Nvidia Treiber
Hast Du eine Empfehlung für eine "bessere Ecke" der Nvidia Treiber? Ich bin davon ausgegangen, dass wenn ich deren Boardmittel/Software verwende und die neuste Treibergeneration, ich gut aufgestellt sei. Dem ist scheinbar nicht so?
@vert1go, ich glaube, da hast du @Mark O. falsch verstanden.
Den Treiber natürlich von der NVidia-Seite holen. Aber aufpassen, dass die Software "Geforce Experience" nicht mit installiert wird, da diese oft Probleme bereitet.
 
Ob da was überhitzt könnt ihr relativ einfach testen einmal durch den cinebench r20 und prime 95 jagen schmiert er da ab ist es die CPU und im Anschluss durch die ersten beiden Test vom 3d Mark Timespy. Furmark taugt da schon seit längerem nemer für. Geht zwar derzeit nichts über den AC Odyssey in Game Benchmark aber dafür müsste man das Spiel auch erstmal haben. Wenn er dabeio zickt ist es dann die GPU. Und dabei immer schön die Sensoren auslesen wenn man schon HW Info hat. Auf den überwiegenden Rest kann man sich nämlich ein Eis backen
 
Anzeige
Oben