Anzeige

Am Puls von Microsoft

Anzeige

Immer mal wieder Grafik-Ärger

ASUS Radeon RX560 4 GB OC
Ist der Treiber dafür direkt von AMD oder von Asus? (Wenn ich raten sollte, würde ich auf AMD tippen!)

Hatte vor 2 Jahren eine Asus Radeon, die mit dem AMD-Treiber permanent gecrasht ist, mit dem von Asus bereitgestellten Treiber hingegen sauber lief.
Die Treiberangaben bei Asus bezüglich Version und Bezeichnung waren interessanterweise identisch mit den Angaben bei AMD, jedoch waren die beiden Pakete unterschiedlich gross - würde mich nicht wundern, wenn da auch inhaltlich seitens Asus Anpassungen an die Grafikkarte vorgenommen wurden.
Falls also der Treiber von AMD im Einsatz ist, wäre es zumindest einen Versuch wert, wie sich der Asus-Treiber verhält.
 
Anzeige
Tippen müssen muss ich gar nichts. Vehement schonmal überhaupt nicht. Ich dachte halt, hilfst du dem mal. Muss ich natürlich auch nicht. Also nerv ich dich eben nicht mehr. Ich hätte dir auch deine Sensoren (alle) analysiert. Wenn du das festzustellende Ergebnis aber schon im vorhinein festlegen willst macht das keinen Sinn.
Schönen Tag noch

In deiner Dumpfile steht
Drei mal der Ryzen Master aktiv , jeweils von 2018, 2019 und 2020
Dazu einiges an Asus und sonstigen Tools
AsIO von 2012, AsUpIO und AsIO2 von 2019
Was dieser RD Video MNiniport sein soll erschließt sich mir nicht. Ich vermute mal Remote Desktop Video Miniport
Sieht aus wie eine Steuerung über ein LG Smartphone.
lgcoretemp von 2015
Iomap64
LgvirtHID (und andere Treiber dieser Anwendung) von 2016

Da steht jede Menge altes und unnützes Zeug in der Modulliste. Vor allem Sachen, die sich mit der Bezeichnung TOOL schmücken.

Prozess Name: System _ ist der gemeldete Verursacher
Faulting IP ist (zugegeben) amdkmdag
Default Bucket ID : Graphics Driver Engine Timeout _allerdings steht da nicht warum der in einen Timeout läuft

Jetzt schaun wir mal: von unten nach oben lesen


watchdog!WdpDbgCaptureTriageDump+0x64a
watchdog!WdDbgReportRecreate+0xd0
dxgkrnl!TdrUpdateDbgReport+0x119
dxgmms2!VidSchiResetEngine+0x709
dxgmms2!VidSchiResetEngines+0xb1
dxgmms2!VidSchWaitForCompletionEvent+0x26559
dxgmms2!VidSchiWaitForCompletePreemption+0x7e
dxgmms2!VidSchiCompletePreemption+0x13
dxgmms2!VidSchiPreemptEngineNodes+0x117
dxgmms2!VidSchiPrepareToResetEngine+0xff
dxgmms2!VidSchiCheckHwProgress+0x26049
dxgmms2!VidSchiWaitForSchedulerEvents+0x372
dxgmms2!VidSchiScheduleCommandToRun+0x2ca
dxgmms2!VidSchiRun_PriorityTable+0x35
dxgmms2!VidSchiWorkerThread+0xca
nt!PspSystemThreadStartup+0x55
nt!KiStartSystemThread+0x28


Im Spoiler sieht man ein Problem der Berechtigungen der Prozesse , deren Folge bis zum Reset des Grafiktreibers geht.
Es werdem Ressourcen angefordert , die von anderen Prozessen verwendet werden. Deshalb kommt es zu einer zeitweisen Unterbrechung der Bearbeitung eines Vorgangs (hier des Grafiktreibers).
Dieser Reset endet letztendlich in einem Timeout weil dieser nicht mehr aufgelöst werden kann. Ist doch ganz einfach. Das System beschäftigt sich mit sich selber und die Tools streiten sich im Hintergrund, wer auf dem Systembus den primären Zugriff haben dürfte.

Wenn man noch die Hardware im SMBios auslesen könnte würde ich dir mehr über dein Systen sagen können. So richtig neu aufgesetzt sieht das nicht aus.

Der Grafiktreiber ist also hier das Opfer deiner Umstände. Wenn dir das jetzt hilft dann mach. Viel genauer bekomme ich das mit deinen Daten nicht hin. Du kostest echt Nerven. Macht nichts, ich hab gerade Zeit.
 
Zuletzt bearbeitet:
Tippen müssen muss ich gar nichts. Vehement schonmal überhaupt nicht. Ich dachte halt, hilfst du dem mal. Muss ich natürlich auch nicht. Also nerv ich dich eben nicht mehr. Ich hätte dir auch deine Sensoren (alle) analysiert. Wenn du das festzustellende Ergebnis aber schon im vorhinein festlegen willst macht das keinen Sinn.

Wie gesagt, wenn du mir verrätst, wie ich die Sensoren sichtbar mache, die du erwartest, mache ich das sofort. Ich habe das Tool, was hier bei solchen Analysen als gewünschtes Systeminfo-Tool genannt wird, gestartet, die Liste der Sensoren geöffnet und alles was ich sehen konnte in den Screenshot gepackt.

Drei mal der Ryzen Master aktiv , jeweils von 2018, 2019 und 2020

Das Paket ist einmal installiert. Möglich, dass der unterschiedlich alte Treiber mitbringt. Ist zumindest die aktuelle Version. Kann ich aber auch mal deinstallieren. War nur aus Interesse und als zusätzliches Anzeigetool installiert.

Dazu einiges an Asus und sonstigen Tools
AsIO von 2012, AsUpIO und AsIO2 von 2019

Stimmt, es ist ursprünglich die ASUS Software zur Lüftersteuerung und -überwachung sowie zur Steuerung der LEDs installiert worden.

Was dieser RD Video MNiniport sein soll erschließt sich mir nicht. Ich vermute mal Remote Desktop Video Miniport

Denke ich auch. Da es aber eine Windows-Komponente ist, hatte ich da nicht weiter drauf geschaut.

Sieht aus wie eine Steuerung über ein LG Smartphone.
lgcoretemp von 2015
Iomap64
LgvirtHID (und andere Treiber dieser Anwendung) von 2016

Fast. ;) Logitech. Software für die G810 Tastatur. Allerdings tatsächlich noch das klassische Paket, da diese moderne "G HUB" Geschichte einfach nur zur Bloatware geworden ist.

Es werdem Ressourcen angefordert , die von anderen Prozessen verwendet werden. Deshalb kommt es zu einer zeitweisen Unterbrechung der Bearbeitung eines Vorgangs (hier des Grafiktreibers).
Dieser Reset endet letztendlich in einem Timeout weil dieser nicht mehr aufgelöst werden kann. Ist doch ganz einfach. Das System beschäftigt sich mit sich selber und die Tools streiten sich im Hintergrund, wer auf dem Systembus den primären Zugriff haben dürfte.

Nun, das ASUS Softwarepaket kann ich ja mal deinstallieren. Ohne die Software zur Tastatur wirds schon schwieriger. Und mehr wilde Sachen sind an sich nicht drauf.

Wenn man noch die Hardware im SMBios auslesen könnte würde ich dir mehr über dein Systen sagen können. So richtig neu aufgesetzt sieht das nicht aus.

Wie gesagt, zeige ich gerne, wenn du verrätst, wie ich das anstelle.

Neu aufgesetzt ist das System auch nicht. Der Rechner wurde im September 2018 aufgebaut und installiert. Normalerweise laufen Windows-Installationen bei mir ziemlich lange. Ich meine, das müsste die erste Windows-Installation von damals sein.
 
Das ist halt kompliziert wenn mehrere Monitoring Tools, gleichzeitig , sich um den Zugriff auf die Sensoren über den Systembus streiten. Ob die nur passiv im Autostart stehen oder (teilweise) aktive Prozesse am laufen haben ist nicht immer ersichtlich. Wenn zusätzlich noch, unter Windows, Leistungsparameter beeinflußt werden, deren Einstellung eigentlich besser im Bios gesetzt werden sollte (mein Erfahrung), kann das bei kleinsten Verschluckern fatale Folgen haben. Das betrifft nicht nur die Frequenzen der CPU sondern auch Lüftereinstellungen, LED-Gedöns usw.
So jetzt mal HWInfo:
Aktuell ist 7.02 4430
Du rufst die Sensoren auf und rechts unten Configure Sensors anklicken.
Im Reiter Layout alles auf Yes umstellen. Auch wenn Manches unwichtig erschein, schaden tut das nicht. Leider wird dein Netzteil intern nicht von eigenen Sensoren überwacht. M W. gibt es das nur bei den Corsair RM, HX, AX mit i in der Bezeichnung (teuer). Aber egal.
Einen Screenshot im Idle machen (warten bis sich die CPU "beruhigt hat") , dann Vollast nur auf der CPU (Grafik ist egal) und nach wenigen Sekunden (mit stabilen Spannungswerten) den ersten Screenshot unter Vollast machen. Hat sich das System eingependelt und bleiben die Temperaturen halbwegs stabil (5-10 Minuten) den dritten Screenschot machen.
Alles in jeweils ein Bild! Reicht der Platz nicht kann man auf Grafik und Laufwerke zur Not verzichten. Keine Scrollbalken! Nicht rechts und auch nicht unten. Die Laufzeit unten sollte auch zu sehen sein.
Bei CPU #0 die nach rechts weisenden Pfeile anklicken. Wenn der Platz auf dem Desktop nicht reicht zur Not die Laufwerke und den Netzwerkadapter einklappen.


Deine Absturzdatei: stell das um auf Automatisches Abbild und wenn du schonmal dort bist deaktiviere auch den automatischen Neustart bei Systemfehler. Fastboot im Bios hast du oben schon erwähnt. Das sollte auch deaktiviert sein. Das aktiv geht nur, wenn du im professionellen Umfeld absolut keine Veränderungen an der Hardware und deren Einstellung vornimmst. Die zwei Sekunden, die die Hardwareinitialisierung länger dauert, wiegen die evtl. zuTage tretenden Probleme garantiert nicht auf.

Schaumermal
 
Zuletzt bearbeitet:
Du rufst die Sensoren auf und rechts unten Configure Sensors anklicken.
Im Reiter Layout alles auf Yes umstellen. Auch wenn Manches unwichtig erschein, schaden tut das nicht.

Alles dort stand bereits auf Yes. Es gibt keinerlei Punkte dort, die ich zusätzlich umstellen könnte.
Die ASUS Tools sind mittlerweile deinstalliert, sonstige Systemüberwachungstools sind nicht mehr aktiv.

Einen Screenshot im Idle machen (warten bis sich die CPU "beruhigt hat") , dann Vollast nur auf der CPU (Grafik ist egal) und nach wenigen Sekunden (mit stabilen Spannungswerten) den ersten Screenshot unter Vollast machen. Hat sich das System eingependelt und bleiben die Temperaturen halbwegs stabil (5-10 Minuten) den dritten Screenschot machen.

Idle:
Screenshot (11).jpg


Kurze Zeit Last:
Screenshot (12).jpg


15 Minuten später, wärmer wird's nicht:

Screenshot (13).jpg



Ich bin gespannt, was du daraus so erkennen kannst.
 
Das gelb markierte sollte auch ausgeklappt sein. Hat das Board keine Sensoren für die VRM?
HWInfo Sensoren.JPG


Zum Vergleich zu deinem B450 , das Sensorenbild eines B450I Aorus Pro (ITX). Hast du diese Sensoren nicht?
VRM MOS
VRSOC MOS
HWInfo B450I Aorus Pro.JPG


Hier eine Ansicht von mir. Die einzelnen Kerne sollten auch wirklich im Idle laufen. Ansonsten verfälscht das die Spannungswerte und auch die Frequenzen. Alles genauso aufziehen wie hier. Vollast dann ebenso.
X 570 Aorus Pro Idle 2.JPG


Zuerst also Idle und dann auf Vollast und sofort den ersten Screenshot.
So wie das aussieht hast du derzeit auch nicht mehr diese 3,9 zu 4,6GHz anliegen.

Was ich dir jetzt schonmal sagen kann ist das dein Board das Limit deiner CPU auf 127,5262529832936 W festgelegt hat. Obwohl Prime unter angeblicher Vollast läuft kann die CPU diese Leistung nicht ausschöpfen. Die liegt bei ca 107 W Leistungsaufnahme im letzten Bild.
Was genau los ist sag ich dir mit den anderen Bildern.
Ich will mal hoffen, das es ein Auslesefehler ist , aber dein Board würde im Peak 166,9977081741788 W zur CPU durchleiten wollen. Ein Wert den die VRM (4+2 Phasen Design) sowieso nie schaffen würden. Von ungesunden ~150W kannst du aber ausgehen. Gerade weil das Board nur eine beschränkte Sensorenausstattung besitzt kann man nur indirekte Schlüsse ziehen. Deshalb also alle Bilder nochmal. Der erste Mai ist Tag der Arbeit - also ...
 
Das gelb markierte sollte auch ausgeklappt sein. Hat das Board keine Sensoren für die VRM?

Offenbar nicht. Ich habe zumindest nichts abgeschaltet.

Zum Vergleich zu deinem B450 , das Sensorenbild eines B450I Aorus Pro (ITX). Hast du diese Sensoren nicht?
VRM MOS
VRSOC MOS

Wenn, dann wären sie auf dem Screenshot zu sehen. HWiNFO bietet auch in den Einstellungen keinerlei solche Sensoren zur Aktivierung an.

Zuerst also Idle und dann auf Vollast und sofort den ersten Screenshot.

Okay, dann mal los...
Idle. HWiNFO zieht dauerhaft etwa 1 bis 2% CPU, insofern ist das halt nie völlig idle. Aber weiter runter geht es nicht.

Screenshot (14).jpg


Und da hätten wir dann wieder Last:

Screenshot (15).jpg


Und das nach einigen Minuten, als sich die Temperaturen eingependelt haben:

Screenshot (16).jpg


Bis zum ersten Mail wollte ich gar nicht erst warten... ;)
 
Bisher sind noch keine weiteren Probleme aufgetreten. Das muss noch nichts heißen, denn bisher war die Sache ja auch nicht ständig aufgetaucht.

Die Treiber waren vor einiger Zeit schon mal eher instabil, aber mit etwas neueren Versionen hatte sich das eher gelegt. Offenbar ist der aktuellste Standard-Treiber wohl nicht brauchbar für mein System.

Mal schauen, was tkmopped da noch aus den Sensorendaten ausliest. Möglicherweise ist ja nicht nur der Treiber das Problem. Dass AMD über längere Zeit immer mal wieder unbrauchbare Treiber bringt, kann ich mir ja auch nicht wirklich vorstellen.
 
So fang ich mal an.
Jetzt ist dieses System in einem Gleichgewicht, wesentlich besser als in diesen Bildern HW Monitor am Anfang. Auch besser als die Screenshots von 0ben #26. Das rigorose Übertakten ist so nicht zu sehen. Gut. In diesen letzten Screenshots sieht es aus als ob die CPU nun quasi 100% der von den VRM kommenden Leistung permanent zu nutzen in der Lage ist. Das Limit des Boards und die Anliegende Leistung sind in beiden Screenshots fast identisch. In den Frequenzen sieht man nur einen geringen Abfall der Frequenz von 3900MHz zu 3875MHz im Schnitt. Die Spannungen sind auch ziemlich stabil. Ich würde diesen geringen Leistungsrückgang den VRM zuordnen. Leider sieht man dort keine Sensoren. Kann man nicht ändern.
In den vorhergehenden Screenshots in #26 war das kein Rückgang sondern ein regelrechter Leistungseinbruch. Dort unter Vollast 107 W bei 72° (wahrscheinlich den heißen VRM und deren Limit geschuldet) zu jetzt stabilen 125 W.
Ich weiß nicht genau was du gemacht hast, aber dem System geht es damit jetzt besser. Viel besser. Allcore Turbo von 3,9GHz ist ok. 4,2GHz auf einem Kern wird auch erreicht. Der R5 könnte bestimmt etwas mehr, bräuchte dafür aber ein wesentlich besseres Board. Die VRMs setzen hier eben das Limit, nicht die Prozessortemperatur.

Die Temperatur der CPU steigt zuerst schnell auf knapp 70° hält dann aber , trotz dieser 125W stabil ca. 78° . Mit etwas höherer Drehzahl am Kühler wäre dort weniger möglich. Geht aber, die CPU kann das und mehr als Prime 95 geht nicht mehr.
Die Prozessorsteuerung sieht gut aus. Mir wären die Spannungen (1,45V) zu hoch wenn die Kerne im C6 laufen. Liegt wohl am Energieprofil. Prozessorenergieverwaltung erlaubt das heruntertakten soweit auch ok.
Ich würde mal sagen : So sieht das aus, wenn sich die CPU im Rahmen ihrer Spezifikationen bewegt. Geh dort höher bekommst du weniger effektive Leistung, weil sich immer einzelne Kerne in der Frequenz absenken müssen. Nicht wegen der Hitze sondern wegen der Spannung. Die VRM sind dem nicht hinterhergekommen. Deshalb auch die geringere Temperatur von 72° der CPU unter Vollast in #26, genauso wie die geringere anliegende Leistung. In Anwendungen, die nur einen Kern belasten, könnte man mit Übertaktung etwas mehr herausholen. Lohnt aber nur für Benchmarkfetischisten und dann auf einem besseren Board.
Ich habe mal die Leistungen durchgerechnet, egal ob Min, Max oder Current , die liegen jetzt alle zwischen ~ 125 bis 127 W eng beieinander. So sollte es eigentlich sein. Hier ist es jetzt so!
Was soll man noch groß dazu schreiben. Wenn das meiner wäre würde ich das so lassen. Bis auf die Leerlaufspannung geht alles.
Ich weiß nicht ob du im Bios PBO deaktiviert hast oder ob Asus für die B450 verschiedene Leistungsmodi vorbereitet hat. Mein Prime X370 Pro von Asus hat drei voreingestellte Profile (Silent, Standard, Power). Hier sieht das so aus als ob Standard und DOCP zusammen aktiv sind. Ohne andere Stellschrauben aktiviert zu haben.

Wenn man noch die Hardware im SMBios auslesen könnte würde ich dir mehr über dein Systen sagen können.
Dafür mußt du in der erweiterten Systemsteuerung das kleine Speicherabbild auf automatisch umstellen. Dann sollten die Hardwaredaten auch in die Dumpfile geschrieben werden. Eigentlich

Wenn der PC wieder spinnt , nimm eine andere SSD und installiere darauf Windows testweise neu. Gerade wenn es Probleme mit den Privilegien der einzelnen Prozesse gibt, ist Fehlersuche schwierig. Das kann an einem früher einmal installierten Virenscanner gelegen haben, oder Tools die in die Registry eingegriffen haben. Das per Hand neu regeln zu wollen ist Sisyphusarbeit.
Hardwareseitig können Spannungsprobleme solche Timeouts auslösen, wenn das System permanent mit sich selber beschäftigt ist. Eigentlich sollte dann ein WHEA-Error in die Dumpfile geschrieben werden. Die Wege des Herrn ...
 
Ich werde die Tag noch mal testweise probieren, wieder den aktuellen AMD Treiber zu verwenden. Wenn es dann wieder so sehr zickt, dann scheint es da einen Zusammenhang zu geben. Wenn nicht, war es wohl eine der anderen Änderungen.

Nun ja, was wurde sonst geändert? Die ASUS Software zur Steuerung von Lüftern, LED usw. wurde entfernt. Das hat dafür gesorgt, dass die Lüfter mit einer anderen Kennlinie laufen und früher - und m.E. auch etwas hektischer - hochdrehen. Mit der AI Suite Software hatte ich eine entsprechende Silent Kennlinie eingestellt, die im Normalbetrieb die Lüfter im unhörbaren Bereich hält. Die Systemtemperaturen waren da immer im Rahmen.
Offenbar ändert die Software aber gleichzeitig auch noch was am Takt, denn irgendeine Übertaktung der CPU ist wissentlich und willentlich nirgendwo eingestellt gewesen. Und Virenscanner waren hier definitiv nie extra installiert.

Ich werd das jetzt erst einmal so belassen bis auf den AMD Treiber. Wie gesagt, mit dem werde ich noch mal testen.

Vielen Dank für die Auswertung und die vielen Infos!
 
Da die AI Suite nicht vollständig deinstalliert, müsste die Datei mit deinen Lüfterkurven noch vorhanden sein. Die kann man auslesen und dann im BIOS einstellen. Dann hast du dein gewohntes leises Lüfterprofil wieder.
 
Ich hatte bisher im BIOS nur mal die Kalibrierung durchführen lassen und dort dann die leise Voreinstellung gewählt. Das scheint allerdings trotzdem noch in einer höheren Drehzahl der Lüfter zu resultieren, was wenn ich selbiges vorher in der AI Suite gemacht habe.
 
Manuell im Bios auswählen und mit 30 % anfangen dann flach ansteigen und erst oberhalb 60° steiler ansteigen. Besser wäre dafür eine Wakü. Die kann man immer mit leisen Lüftern umbauen.
Meistens ist es eher ein Gehäuselüfter vorne der lärmt. Außerdem müssen die richtigen Sensoren zugeordnet sein. Wenn das gehen sollte.
Einstellen, speichern, testen - wieder zurück - nachregulieren - so lange bis das passt.
Geduldsspiel.
Silentprofil geht bei evtl Sysfan der eine längere Regelträgheit hat
CPU, die schnell aufheizt geht manuell am besten
 
So, und wie heißt es doch so schön: "gestern standen wir noch vor dem Abgrund, heute sind wir einen Schritt weiter". ;)

Ich hab eben wieder den AMD Treiber 21.4.1 installiert. Neustart. Browser auf. Videostream an. Und zack, kompletter Bildschirm zeigt "Schnee" und wird nach einigen Sekunden schwarz. Ein Bluescreen kommt auch nach mehreren Minuten nicht, aber das System reagiert nicht.
Der Treiber hat im Gerätemanager die Version 27.20.21002.112.

Also Treiber komplett wieder runter, den Enterprise 21.Q1.2 drauf. 27.20.14540.4003 wäre hier die Version. Neustart. Browser auf, Videostream an, Furmark an, läuft immer noch. Lässt sich natürlich nach kurzer Zeit noch nichts endgültig sagen, aber irgendwie mögen sich der aktuelle 21.4.1 WHQL Treiber und mein System so gar nicht.

Die Treiber wurden jedes Mal deinstalliert, beim AMD Setup wurde die Neuinstallation ohne Übernahme von Einstellungen gemacht.
 
Manuell im Bios auswählen und mit 30 % anfangen dann flach ansteigen und erst oberhalb 60° steiler ansteigen. Besser wäre dafür eine Wakü. Die kann man immer mit leisen Lüftern umbauen.

Ach, die Lüfter sind schon leise. Ich bin nur empfindlich. ;)
Da stecken zwei beQuiet Lüfter im Gehäuse, vorne ein 140er, hinten ein 120er. So richtig viel dürfte man da nicht mehr einsparen können.

Meist ist aber ja auch nicht völlige Stille im Arbeitszimmer, dann hört man da eh nichts mehr.
 
Und heute mal wieder Rechner an, eine Zeit im Netz gesurft, eine Videostream angeworfen und in der Sekunde, als ich den auf Vollbild stellen will, zack, schwarzer Bildschirm. Fängt sich dann nach ein paar Sekunden und der AMD Treiber meldet, dass es einen Timeout des Treibers gegeben hätte.

Ich hab demnächst Urlaub, dann muss es wohl doch testweise mal eine frische Windows-Installation sein.
Wenn das dann auch nicht hilft, wüsste ich auch nicht weiter. Testweise die Grafikkarte zu tauschen ist ja aktuell bei den Preisen leider keine Option.
 
ich hab demnächst Urlaub, dann muss es wohl doch testweise mal eine frische Windows-Installation sein.

würde ich durchziehen, ich hab bisher noch kein System gesehen, wo die Asus AI Suite wirklich restlos eliminiert wurde

die Grafikkarte würde ich im Bereich Hardware nicht unbedingt priorisieren wollen, da sehe ich die VRM Bestückung des Mainboards eher als Schwachpunkt
 
Anzeige
Oben