Anzeige

Am Puls von Microsoft

Anzeige

Immer mal wieder Grafik-Ärger

IngoBingo

Moderator
Teammitglied
Moin,

jetzt hab ich auch mal ein Problem und vielleicht hat ja einer der Anwesenden Hardware-Spezis ein paar Ideen.

Das Problem: mein Grafiktreiber läuft ab und zu in einen Timeout, d.h. der Bildschirm wird schwarz, danach erfolgt vom Treiber ein Hinweis, dass ein Timeout-Fehler aufgetaucht sei. Alternativ taucht auf dem Bildschirm nur Müll auf. Nach zwei Minuten wird dann der Bildschirm schwarz und danach ist Reset angesagt. Das System hängt komplett, d.h. NumLock reagiert nicht mehr.

Es taucht schon länger mal selten auf, heute aber tatsächlich mehrfach hintereinander. Gerne wenn ich im Edge Browser im Internet unterwegs bin. Allerdings ist das aktuell auch die Haupt-Beschäftigung an diesem PC. Spiele werden auf dem System nicht genutzt.

Ich habe heute mit Prime95 und FurMark mal etwas Last erzeugt. Beim ersten Versuch wurde das Problem tatsächlich dadurch reproduziert. FurMark wurde geschlossen, die Fehlermeldung des Treiber-Timeouts tauchte auf. Beim zweiten Versuch in selbiger Konstellation konnte es nicht mehr reproduziert werden.

System:
ASUS Prime B450-PLUS, BIOS 2807
AMD Ryzen 5 2600X
2x 8 GB RAM GSkill F4-3200C16-8GTZR
ASUS Radeon RX560 4 GB OC
Samsung 970 EVO NVMe SSD
Seasonic 550 Watt Focus+ Gold Netzteil
Alphenföhn Brocken auf der CPU.

AMD Chipsatztreiber und Grafiktreiber sind aktuell. Ryzen Powerplan ist eingestellt. Windows 10 ist aktuell. Schnellstart in Windows ist aus.

HWInfo:

Screenshot (4).jpg


HWMonitor bei Vollast:

Screenshot (2).jpg


Teil 2:
Screenshot (3).jpg



Vielleicht hat ja jemand Ideen. Danke vorab!

Ingo
 
Anzeige
Stell mal in dem Ryzen Powerplan auf "Ausbalanciert", scheint auf "Höchstleistung" zu stehen.
 
- das BIOS ist nicht aktuell, das solltest du in jedem Fall updaten, danach im BIOS PBO und Fastboot deaktivieren


- der RAM steht zwar nicht in der Asus QVL, dafür steht das Mainboard aber in der G.Skill QVL und das ist bei deren Aktualität entscheidend, sollte also passen


- das Netzteil sollte auch keine Probleme erzeugen


- für die Grafikkarte und jetzt wird es interessant hätte ich zwei Punkte die helfen könnten:

1. man kann in den Eigenschaften des Radeon Treibers der AMD Grafikkarte unter Grafik ->Standard ->die Option Radeon Enhanced Sync deaktivieren, was wiederum die Stabilität maximiert

2. die AMD Enterprise Treiber sind sehr zu empfehlen, insbesondere bei Problemen aus der Richtung wie in deinem Fall

->https://www.amd.com/de/technologies/radeon-pro-software


- Ryzen balanced für die Energieoptionen ist Pflicht für das System
 
Ob das tatsächlich der Grafiktreiber ist wäre die Frage. Nach deinen Sensoren läuft die CPU mit 120W Dauervollast ohne die Peaks. Für diese CPU wäre ein B 450 E ROG Strix die wesentlich bessere Wahl gewesen. Wenn es denn unbedingt ein B450 gewesen sein muß.
Die Turbofrequenz der CPU beträgt lt. Specs 3,6 zu 4,2 GHz (für einen Kern). Bei dir sind das lockere 3,9 zu 4,635 GHz. Das erklärt diese 119,77W bei 81°. Dein HW Monitor zeigt die VRMs nicht, aber ich denke die drosseln die CPU, weil diese VRM gerade an der Grenze laufen. Deshalb läuft auch die CPU nicht dauerhaft annähernd mit den Werten, die unter Max angezeigt werden. Diese werden nur so lange erreicht bis die Temperaturbegrenzung der VRM denen einen Riegel vorschiebt. Was dort im Peak nicht angezeigt wird wäre (m. Mn.) irgendwo bei 140 - 150W anzusetzen.
Die Grafik RX 560 hat selber nie ein Temperaturproblem. Das ist eine bessere Office Grafik und gut für ältere MM-Codecs in Hardware. Hatte ich selber zwei Stück für FHD-Videos. Dafür sind die gut genug. Diese 68° bei knapp 50W ist halbe Last, mehr nicht.
Mit 1240x720 und ohne MSAA ist dieser Furmark eigentlich ohne jede Relevanz. Das macht nur Sinn mit nativer Monitorauflösung. Das ist so nicht mal 720P Auflösung. Sinnlos eine Grafik mit so einem "Benchmark" (im Fenster) zu langweilen.
Grafiktreiber ist aktuell 21.4.1 wie das aussieht. Wenn das Bios allerdings veraltet ist wird der Chipsatztreiber nicht viel anders aussehen.
Der GTZR steht annähernd in der QVL. Ziemlich dünn gesäte GSkill , ein TridentZ und ein Ripjaw sowie zwei FlareX von denen letztere alle drei nur auf einem Port laufen dürfen (wenn das in der QVL stimmt , ist schon komisch).
Der Grafiktreiber ist nicht der Verursacher sondern das Opfer. Der versucht jedesmal einen Neustart im laufenden System, mit obigem Ergebnis.
 
Stell mal in dem Ryzen Powerplan auf "Ausbalanciert", scheint auf "Höchstleistung" zu stehen.
Danke. Es gibt allerdings nicht mehrere verschiedene Ryzen Powerpläne. In den Windows Energieoptionen ist das Ryzen Schema gewählt.

- das BIOS ist nicht aktuell, das solltest du in jedem Fall updaten, danach im BIOS PBO und Fastboot deaktivieren

Hm, tatsächlich, da gibts schon wieder ein Update. Ich schau tatsächlich nicht ständig auf die ASUS Seite. Aber da dort was von verbesserter Systemstabilität genannt ist, werde ich das mal einspielen.
- der RAM steht zwar nicht in der Asus QVL, dafür steht das Mainboard aber in der G.Skill QVL und das ist bei deren Aktualität entscheidend, sollte also passen

Auf der ASUS QVL findet sich das Kit.
1619359716475.png


Ich hatte damals extra drauf geachtet, dass die Komponenten passend und freigegeben sind. Ich hab allerdings oben nur die Bezeichnungen der einzelnen Module genannt.

1. man kann in den Eigenschaften des Radeon Treibers der AMD Grafikkarte unter Grafik ->Standard ->die Option Radeon Enhanced Sync deaktivieren, was wiederum die Stabilität maximiert

Werde ich testen.
2. die AMD Enterprise Treiber sind sehr zu empfehlen, insbesondere bei Problemen aus der Richtung wie in deinem Fall
->https://www.amd.com/de/technologies/radeon-pro-software

Wenn ich dem Link folge, lande ich auf der AMD Seite und kann für die "PRO Software" auf "Jetzt herunterladen" klicken. Damit lande ich auf der normalen Downloadseite.


Und dort wird mir für meine Grafikkarte keine PRO Software angeboten. Ist es sinnvoll, dort eine der anderen Karten auszuwählen und wenn ja, welche?

- Ryzen balanced für die Energieoptionen ist Pflicht für das System

Ist bereits eingestellt, wie oben erwähnt.

Danke!
 
Ob das tatsächlich der Grafiktreiber ist wäre die Frage. Nach deinen Sensoren läuft die CPU mit 120W Dauervollast ohne die Peaks. Für diese CPU wäre ein B 450 E ROG Strix die wesentlich bessere Wahl gewesen. Wenn es denn unbedingt ein B450 gewesen sein muß.

X470 Boards hatte ich damals für den Zweck als etwas übertrieben angesehen. Das ist ja nun keine Gaming-Kiste mit Übertakter-Ambitionen.

Die Turbofrequenz der CPU beträgt lt. Specs 3,6 zu 4,2 GHz (für einen Kern). Bei dir sind das lockere 3,9 zu 4,635 GHz. Das erklärt diese 119,77W bei 81°. Dein HW Monitor zeigt die VRMs nicht, aber ich denke die drosseln die CPU, weil diese VRM gerade an der Grenze laufen.

Lässt sich das irgendwo mit anderen Tools auslesen, wie ausgelastet die VRMs sind?

Deshalb läuft auch die CPU nicht dauerhaft annähernd mit den Werten, die unter Max angezeigt werden. Diese werden nur so lange erreicht bis die Temperaturbegrenzung der VRM denen einen Riegel vorschiebt. Was dort im Peak nicht angezeigt wird wäre (m. Mn.) irgendwo bei 140 - 150W anzusetzen.

Die 81°C sind allerdings ja völlig im Rahmen für die CPU. AMD nennt maximal 95°C. Da bleibe ich ja weit drunter.

Es sind halt auch immer nur Grafikprobleme. Als es mal einen Crashdump gab, war es immer aus Richtung Grafiktreiber. Wenn das Board an der Grenze wäre, würden die Probleme ja nur unter CPU Last auftauchen und ggfs. müsste Windows auch mit anderen Problemen crashen. Tut es nicht. Immer nur Grafik, egal ob mit Bildfehlern oder nicht.

Mit 1240x720 und ohne MSAA ist dieser Furmark eigentlich ohne jede Relevanz. Das macht nur Sinn mit nativer Monitorauflösung. Das ist so nicht mal 720P Auflösung. Sinnlos eine Grafik mit so einem "Benchmark" (im Fenster) zu langweilen.

Okay, ich wiederhole das noch mal in voller Auflösung und ohne Prime95 im Hintergrund.

Grafiktreiber ist aktuell 21.4.1 wie das aussieht. Wenn das Bios allerdings veraltet ist wird der Chipsatztreiber nicht viel anders aussehen.

Ich sehe da jetzt grad keinen Zusammenhang. Das BIOS ist nebenbei eine einzige Version zurück und nicht uralt. Das Problem tritt auch schon länger auf. Dass nun gerade dieses fehlende Update das löst, wäre schon ein sehr großer Zufall. Ich update das aber natürlich trotzdem. Schon um diese Sache auszuschließen.

Der Grafiktreiber ist nicht der Verursacher sondern das Opfer. Der versucht jedesmal einen Neustart im laufenden System, mit obigem Ergebnis.

Wie gesagt, dann wundert es mich, warum es immer und ausschließlich der Grafiktreiber ist, der das Opfer ist, so denn die Auslöser ganz woanders liegen sollten.
 
Ich habe jetzt das BIOS aktualisiert. Danach PBO und FastBoot aus. Sonstige Einstellungen bleiben auf Auto.
Chipsatztreiber geprüft, ist aktuell.
Ryzen-Powerplan geprüft, ist tatsächlich aktiv.
Radeon Enhanced Sync ist aus und war es auch vorher immer.

System gestartet und einzig FurMark gestartet.

System läuft wenige Minuten, dann schwarzer Bildschirm und nach einigen Sekunden kommt die Meldung, dass der GPU Treiber gecrasht ist und FurMark ebenfalls.

Screenshot (5).jpg


Das System als solches läuft weiter.

Dann FurMark neu gestartet und testweise auch noch wieder Prime95 dazu.

Screenshot (9).jpg


...und das läuft dann wieder.

Sprich: mal kommt innerhalb von wenigen Minuten der Crash und mal läuft es dann - auch mit deutlich mehr Last - problemlos durch.
Offenbar hat der RAM-Takt und die Funktionen wie PBO keinen Einfluss. Nur was denn dann? Doch die Grafikkarte selber?
 
Bezüglich des Powerplan.
 

Anhänge

  • Ryzen Powerplan.jpg
    Ryzen Powerplan.jpg
    141,4 KB · Aufrufe: 220

Anhänge

  • AMD Adrenalin Enterprise Treiber.jpg
    AMD Adrenalin Enterprise Treiber.jpg
    89,1 KB · Aufrufe: 119
Im Fehler steht nur, das eine Anweisung im Ram nicht ausgeführt werden kann. Diese kam zwar von einer AMD Komponente , Furmark betreffend, aber sonst steht dort nichts.
Ereignisanzeige kennst du? Hast du kontrolliert? Was steht dort?
 
Im Zuverlässigkeitsverlauf wird der Crash des Grafiktreibers gemeldet. Code 141, Code 117, Code 1a1. Da allerdings das System selbst sich fängt, gibts keinen Crashdump.

Genaue Meldungen aus dem Eventlog kann ich gerne morgen Abend nachreichen. Die Kiste ist bis dahin erst einmal aus.
 
Dein Fehler tritt im RAM auf, oder im Prozessorcache respektive Speichercontroller - das kann man so nicht genau eingrenzen.
Eine Anweisung, die im RAM nicht ausgeführt werden konnte.
Eigentlich wird bei sowas irgendetwas wegen Temperatur im Grenzbereich instabil. Deshalb kann sich das System das eine mal wieder fangen, oder wenn das zu lange dauert, läuft es in einen Timeout.
Möglich wäre auch ein absinken der Spannungen.
Wie oben schon geschrieben , bei mir wäre mit einem 65W TDP Prozessor bei diesem Board das Limit. Diese laufen in echt mit ca. 90W und besitzen ein echtes Übertaktungspotential.
Bei deinen Sensoren oben fehlt die Hälfte.
Ob es zusätzlich auch etwas mit diesen, von MS reparierten, Gaming Settings zu tun hat , könnte man noch vermuten.
 
Eigentlich wird bei sowas irgendetwas wegen Temperatur im Grenzbereich instabil. Deshalb kann sich das System das eine mal wieder fangen, oder wenn das zu lange dauert, läuft es in einen Timeout.

Ich hab heute den Rechner gestartet, den Browser gestartet, den Download des von Mark O. vorgeschlagenen Radeon Enterprise Treibers gestartet und hatte den ersten Crash des Treibers. Ich würde so etwas jetzt nicht als typische Situation für Temperatur im Grenzbereich ansehen.

Das System meldet im Eventlog dabei folgenden Fehler:

Fehlerbucket , Typ 0
Ereignisname: LiveKernelEvent
Antwort: Nicht verfügbar
CAB-Datei-ID: 0

Problemsignatur:
P1: 141
P2: ffff930d5569d010
P3: fffff8018ec22160
P4: 0
P5: 354c
P6: 10_0_19042
P7: 0_0
P8: 256_1
P9:
P10:

Es wird ein Crashdump angelegt. Den Crashdump habe ich ans Posting angehängt. Mir sagt er nichts, außer dass halt bei der Grafikkarte etwas hing.

Wie oben schon geschrieben , bei mir wäre mit einem 65W TDP Prozessor bei diesem Board das Limit.

Ich kann mich jetzt erst einmal als Käufer nur an das halten, was mir der Hersteller des Boards als getestete und freigegebene Eigenschaften zusichert. Da gibts von ASUS für das Board keine Einschränkungen.

Bei deinen Sensoren oben fehlt die Hälfte.

Kann ich nicht nachvollziehen. Das Bild ist vollständig, das Fenster voll aufgezogen. Es fehlen rechts unten bei den Sensoren ein paar Einträge. Da sich diese nur auf den Netzwerkadapter beziehen, hatte ich das für verschmerzbar gehalten.
Welche Sensoren fehlen dir? Reiche ich gerne nach.

Ob es zusätzlich auch etwas mit diesen, von MS reparierten, Gaming Settings zu tun hat , könnte man noch vermuten.

Bitte womit?
Wie schon geschrieben, ist das hier kein Gaming-System. Ich wüsste nicht, um welche "Gaming Settings" es ginge und was Microsoft daran repariert haben soll.

Ich installier jetzt mal die Enterprise Treiber...
 

Anhänge

  • WATCHDOG-20210426-1813.zip
    70,5 KB · Aufrufe: 75
Es fehlt alles relevante der CPU und der Boardkomponenten. Dort ist die Hälfte der Sensoren nicht aktiviert.

Live Kernel Event ist ein Kernelfehler , hier konkret bei einer Installation. Das kannst du kaum dem Grafiktreiber anlasten. Der läuft zum Großteil auf Benutzerebene, wie schon lange in Windows 10. Schon in Windows 8 ist der Grafiktreiber aus der Kernelebene in den Bereich mit Benutzerprivilegien ausgelagert. Erst danach war ein Neustart im laufenden System sinnvoll möglich.
 
Es fehlt alles relevante der CPU und der Boardkomponenten. Dort ist die Hälfte der Sensoren nicht aktiviert.

Und wo aktiviere ist diese angeblich fehlenden Sensoren?

Live Kernel Event ist ein Kernelfehler , hier konkret bei einer Installation.

Der Crash fand nicht bei einer Installation statt. Wie oben geschrieben crashte der Grafiktreiber, während Edge einen Download durchgeführt hat.

Das kannst du kaum dem Grafiktreiber anlasten. Der läuft zum Großteil auf Benutzerebene, wie schon lange in Windows 10. Schon in Windows 8 ist der Grafiktreiber aus der Kernelebene in den Bereich mit Benutzerprivilegien ausgelagert. Erst danach war ein Neustart im laufenden System sinnvoll möglich.

Nun, alles außer dem Grafiktreiber läuft allerdings problemlos.

Ich habe mittlerweile den Radeon Pro Enterprise Treiber installiert. Das Paket wirkt irgendwie auf mich, als wäre das einfach nur eine ältere Treiberversion, der man im Menü irgendwo ein "Pro" angehängt hat. Aber kann ja gut sein, dass man hier intern irgendwo konservativere Einstellungen wählt.

Lustig ist, dass einem die mit blauem Logo startende Radeon Pro Software in ihren Einstellungen gleich wieder ein Treiber-Update anbieten möchte.
1619464648903.png


Nachdem die Probleme meist eher sporadisch auftauchten und ich sie heute nach der Installation des etwas älteren Pro Treibers grad nicht manuell irgendwie reproduzieren kann, werde ich das mal ein paar Tage beobachten.

Wenn sich die Häufigkeit des Auftretens der Probleme durch ein Treiber-Downgrade beeinflussen lässt, verstehe ich allerdings immer weniger, wieso du da so vehement alle möglichen Quellen für Probleme siehst - nur nicht den Grafiktreiber.
 
Anzeige
Oben