Anzeige

Am Puls von Microsoft

Anzeige

[gelöst] [AMD] BSODs - Hardware oder OS?

NoRegister

kennt sich schon aus
1. Aktuelle Hardware:
  • Prozessor (CPU): AMD Ryzen 9 3950X, 16x 3.5GHz, 64MB L3 Cache
  • Arbeitsspeicher (RAM): 64GB (2x 32GB Kit) DDR4-3200 CL16, Corsair Vengeance LPX
  • Mainboard: MSI MEG X570 Unify, AMD X570, So. AM4
  • Netzteil: 850W - Corsair TXM Series Modular, 80PLUS Gold
  • Gehäuse: Fractal Design Define 7 schwarz, Glasfenster
  • Grafikkarte: NVIDIA GeForce RTX 3090, 24GB (MSI Ventus 3X)
  • SSD: (WIN): 1TB Corsair MP600, M.2 PCIe 4.0 (CSSD-F1000GBMP600);
  • SSD 2: 2TB Samsung 970 Evo Plus, M.2 PCIe (MZ-V7S2T0E)
  • FAN: be quiet! Dark Rock PRO 4
  • HD-Audio Onboard
  • Standard NVLink-Bridge
  • PCC: LogiLink PCI Express Interface Card USB 3.0 4x (PC0057)
  • OS: Windows 10 (Build 19042)
cpu_01.jpg

2. Mein Problem:

Hi,

ich hatte mir Oktober 2020 eine Workstation zusammenstellen lassen (Online Händler) - Garantie noch 3 Jahre.
Probleme fingen dann erst langsam März 2021 an, als ich in Unreal 4 auf Direct X 12 und RTX in den Projekten umgestiegen bin, also der PC auf voller Leistung lief.

Zuerst hatte der PC Probleme aus dem Ruhestand (Energiesparmodus,) zurückzukehren - ging nur noch per Knopfdruck (Power Button), dann irgendwann Blackscreens oder automatisches Runterfahren.

Seit einigen Tagen dann BSODs. Gefühlt schmiert der Computer meist dann in der Idle Phase ab oder bei leistungsarmen Aktivitäten (z.B E-Mails lesen) weniger unter Volllast (z.B Unreal Editor oder 3D Progs).

BIOS ist vom Hersteller konfiguriert worden und gebranded. Habe bis Dato da noch nichts angefasst oder verändert.
Ansonsten bekomme ich immer unterschiedliche BSODs. Einzige Gemeinsamkeit ist der "ntoskrnl.exe" error.

3. Versuche zur Problemlösung bisher:

- Energiesparmodus deaktiviert + Höchstleistung eingestellt.

- Die Letzten Win 10 Updates deinstalliert + ältere Graka-Treiber intalliert

- RAM mit Win 10 Tools und MemTest 86 (www.memtest86.com) überprüft >> keine Fehler

- SSDs mit Win 10 Tools und CrystalDisk überprüft >> keine Fehler

- Win 10 Dateisystem überprüft -> keine Fehler

- WiFI + Blue Tooth deaktiviert

- Norton komplett deinstalliert

- PC an andere Steckdose und von der Leiste weg, da als der PC nen BSOD hatte, auch mein Switch kurzfristig nicht mehr funktionierte (also Netzwerk/Internet war auf meinem 2. Rechner weg)

- Prime 95 im normalen Modus getestet. -> Schmiert dann irgendwann ab (Blend); bei "Small FFTs" sofortiger Absturz mit Bluescreens.

- Prime 95 im abgesicherten Modus getestet. -> Rounding Errors (Blend); bei "Small FFTs" sofortiger Absturz mit Bluescreens oder heftige Rounding Errors mit Crash wenige Minuten später.


Ich würde gerne evaluieren, ab es ein Hardware Fehler oder ein OS Fehler ist, bevor ich das ganze Teil wieder zurückschicken muss.

Danke.

P.S: Hab die aktuelle Dump File angehängt. Falls Bedarf kann ich auch die Alten noch uploaden.
 

Anhänge

  • Crystal_MemTest.rar
    29,6 KB · Aufrufe: 110
  • MDump_042721-9546-01.rar
    292,5 KB · Aufrufe: 104
Anzeige
Hallo @NoRegister ,

erstmal Herzlich Willkommen hier im Forum! :)

was mir aufgefallen ist: Dein BIOS scheint nicht aktuell zu sein. Bring doch das mal auf den neuesten Stand und überprüfe alle BIOS-Einstellungen danach (eventuell werden die beim Update nicht richtig gesetzt).
 
Hallo @NoRegister! Willkommen im Forum! 🙋‍♂️
In der Dumpfile ist ersichtlich, dass der Rechner während Prime95 abgestürzt ist, weil ein Heap-Pool nicht alloziert werden konnte.
FAILURE_BUCKET_ID: 0x3B_c0000005_win32kfull!Win32AllocPoolImpl
Aber für mich wichtiger ist:
-> das BIOS ist nicht aktuell
Installiert ist
Version A 3.0
Datum 16.01.2020

Verfügbar ist
Version A 8.0
Datum 25.01.2021
Es gibt sogar eine BetaVersion
Version A 9.3
Datum 8.04.2021
In der Regel sind die Beta-Version ziemlich sicher.

Wenn das BIOS aktualisiert ist, sollten sofort die aktuellen Chipsatztreiber installiert werden. Gerade bei Ryzen-Systemen kommt es darauf an, dass die Chipsatztreieber und das BIOS aktuell sind.
Danach ist in den Energieoptionen "Ryzen balanced" einzustellen.

Diese beiden Treiber
AMDRyzenMasterDriver.sys Mon Dec 16 06:10:07 2019
AMDRyzenMasterDriver.sys Wed Apr 1 06:07:41 2020
zeigen, dass da einiges an Updates nötig ist.

Nachtrag:
Und wenn du einmal in den Energieoptionen bist, deaktiviere den Schnellstart. Der bereitet nur Probleme, vor allem, wenn man SSD im Einsatz hat.

Nachtrag2:
Bei der Deinstallation von Norton hast du doch sicher das Remove-Tool verwendet? Wenn nicht, solltest du das noch nachholen.
Und künftig bitte unter Windows 10 auf Fremd-AV-Programme verzichten.
 
Zuletzt bearbeitet:
die QVL Liste ist bei dem MSI Unify zwar lang, aber bisher finde ich den verbauten RAM da nicht

- das BIOS sollte auf jeden Fall aktualisiert werden


- dann im BIOS auch gleich Fastboot bzw. Systemschnellstart, CPB und PBO deaktivieren, damit wird die sichere Initialisierung aller Komponenten während des Bootvorgangs sichergestellt und die stellenweise gewagten Übertaktungsoptionen von AMD deaktiviert, was die Systemstabilität deutlich erhöht

->siehe beigefügte Screenshots


- für die Systempflege sind aktuelle Chipsatztreiber direkt von AMD eminent wichtig:

->https://www.amd.com/de/support/chipsets/amd-socket-am4/x570

achte darauf, dass wirklich alles angebotene vom Chipsatztreiber installiert wird und nicht nur Fragmente

->siehe beigefügten Screenshot


- nach dem notwendigen Neustart den Energiesparplan auf AMD Ryzen Balanced stellen, die Leistungsverluste dadurch sind gering, die Vorteile gleichen das locker aus, das System arbeitet stabiler


- ferner sollte eine spzielle PCI Express Einstellung in den Energieoptionen geprüft werden, damit sich dieser Bereich nicht ungewollt schlafen legt

->beigefügter Screenshot


- bei der Installation aktueller Nvidia Grafikkartentreiber sollte man darauf achten, dass der Bereich Geforce Experience nicht mit installiert wird, das erspart später eine langwierige und nervige Suche nach der Ursache für nicht nachvollziehbare Probleme.


- ist der Schnellstart bei dir aktiv geschaltet? dann deaktiviere ihn

Windows 10: Schnellstart deaktivieren/aktivieren


- ein Check der Systemdateien auf Integrität sollte auf jeden Fall durchgeführt werden, dazu die Eingabeauffoderung mit Adminrechten starten und dort sfc /scannow eintippen. Sollten sich nach Ablauf Fehler zeigen, das Ganze so oft wiederholen, bis keine Fehler mehr angezeigt werden, dann ein Neustart des Systems


- achte darauf keine Tuning Tools zu verwenden (auch nicht Ryzen Master), nicht an der Auslagerungsdatei (Pagefile) von Windows zu schrauben und auf Drittanbieter Virenscanner unter Windows 10 zu verzichten, der Windows Defender reicht definitiv aus


- im Autostart von Windows 10 (Taskmanager/Autostart) sollte sich außer dem Windows Defender möglichst nichts weiter aufhalten

- der Rechner sollte einen eigenen Stromanschluß besitzen und nicht an einer Mehrfachleiste angesteckt sein


- für Hochleistungsgrafikkarten ist nicht nur eine adäquate Stromversorgung sehr wichtig, auch die Zuteilung der Netzteil-Stränge spielt eine entscheidende Rolle, weil es einige Netzteile gibt, die die 12Volt Stromschiene nicht nur stumpf als Single-Rail ausgelegt haben, sondern auch eine Stromverteilung über eine Multi-Rail Anbindung bieten, wie beispielsweise die aktuellen be quiet Staight Power 11 und Dark Power Pro 12 bzw. Dark Power 12.
Insofern sollte man darauf achten, dass für jeden Stromanschluss auf der Grafikkarte ein entsprechender Anschlusstrang der Netzteil PCIe Leitungen ausgewählt wird. So wird sichergestellt, das jeder Stromanschluss der Grafikkarte über eine eigene Stromschiene (Rail) versorgt wird, was die Stabilität extrem erhöht.

Weitere Infos zu dem Thema und warum Adapter o.ä. Gift sind für eine sichere Stromversorgung:

->Grundlagen GPUs: Leistungsaufnahme, Netzteilkonflikte & andere Mythen | 2014 und 2020 | Seite 6 | igor´sLAB
 

Anhänge

  • AMD Chipsatztreiber Installation.jpg
    AMD Chipsatztreiber Installation.jpg
    55,7 KB · Aufrufe: 134
  • amd Ryzen balanced.jpg
    amd Ryzen balanced.jpg
    78,6 KB · Aufrufe: 123
  • CPB deaktivieren.jpg
    CPB deaktivieren.jpg
    220,3 KB · Aufrufe: 154
  • PBO deaktivieren.jpg
    PBO deaktivieren.jpg
    134,8 KB · Aufrufe: 142
  • whea-fehler.jpg
    whea-fehler.jpg
    107,3 KB · Aufrufe: 113
@Mark O. , doch der RAM ist in der QVL
CORSAIRCMK64GX4M2E3200C16 ver5.492133MHz3200MHz3200 MHzSK hynix MJR1.35vDUAL32 √ | √ |
Ich habe die Bezeichnung erst oben in die Suche der QVL eingegeben. Und dann bin ich die QVL noch mal "zu Fuß" durchgegangen.

Und bei Corsair steht der Chipsatz X570 auch drinnen.
 
Dumpfile 9546
PROCESS_NAME: prime95.exe

bei dieser Hammer CPU wäre die Stromversorgung die Schwachstelle schlechthin. Dafür hätte es m.Mn. mindestens ein HX 850 sein sollen , noch besser ein AX - gerne auch mit etwas mehr Leistung als diese 850W des TX. Nicht weil das nicht reichen würde sondern weil das TX nicht genügende Anschlüsse dafür besitzt.
Die CPU (alleine ohne Chipsatz) liegt unter Vollast bei 250W (im Peak darüber) und die RTX 3090 reißt jede Hürde bei 500W im Peak. Jedes Teil für sich ist eine Granate im wahrsten Sinne des Wortes.
Wenn ich mir diese modularen Stecker am Netzteil ansehe kann das damit nichts werden. Die CPU braucht alles was am Board vorhanden ist an Stromversorgungsanschlüssen. Das ist keine R5 3600 der ein einzelner 8Pin dicke reicht. Der EPS-Anschluß für diese CPU auf dem Board braucht beide 8Pin Anschlüsse. Noch schlimmer ist das mit der RTX. Auch diese muß mit beiden 8Pin PCIe Anschlüssen verbunden sein. Dafür sollte jeweils ein eigener Strang zum Netztreil gehen. Keine geteilten 2x8 auf einem Strang.
2x 8Pin PCIe mach 2x 150W plus der Port macht nur 375W nach Standard, bei Leistungswerten über 500W! Das kann mit diesem Netzteil auf beiden Schienen (CPU und Grafik) nicht funktionieren. Oder du betreibst alles undervoltet und ohne Turbo. Auch dann wird das eng auf Dauer.
Gerade mit Prime95 mit small FFT ist das kein Wunder das die Kiste abschmiert.
Was in der Modulliste fehlt, wären auch einige Komponenten des AMD Chipsatztreiberpaketes.
Bios aktuell und Chipsatztreiber neu wird dir nicht schaden, braucht dein System. Stabilere Stromversorgung aber auch unbedingt. Wenn du denn überhaupt sowas derzeit zu kaufen bekommst.

Die Einstellung der CPU (lief beim Crash mit 3,5GHz) liegt mit 4725 MHz nur 25MHz über den Specs. Klingt nicht viel macht bei diesen selektierten CPU-Dies aber eine Menge aus. Exponentielles anwachsen des Stromverbrauchs , das nicht mit der Zunahme der Leistung korrespondiert.
Zum Spielen wäre ein R7 5800X wesentlich besser gewesen. Als Workstation nimmt man das an Kernen, was man kriegen kann.
Das nächste wäre der Ram, der mit 3000MHz nicht im XMP läuft , also wahrscheinlich auch nicht mit der richtigen Spannung von 1,35V. Warum überhaupt Vengeance mit 3200MHz ? Der native Takt des Speichercontrollers beträgt 1800MHz und demzufolge der des Ram optimal bei 3600MHz. Je nachdem in welchem Modus der Controller arbeitet.
Da aber Ram mit 3200MHz im XMP verbaut ist sollte dieser auch mit diesem Speichertakt laufen. (Ich hätte GSkill Trident genommen)
 
Hallo zusammen,

erstmal Danke für die schnellen Antworten und Tipps.:)(y)

Ich fasse mal kurz zusammen:

- Ja, Norton hatte ich mit removal tool entfernt.

- Zum Bios: Der Computer ist erst nen Halbes Jahr alt und hat noch Garantie. Bios ist gebrandet und Win 10 vorinstalliert.

Geht mir momentan nur darum, falls ich flashe, dass mir das nicht wegen der Garantie negativ ausgelegt werden kann?

- Netzteil: Hatte ich von Anfang an im Auge, da Asus in der Presse später für seine RTX 3090 ( + CPU) 1000 Watt veranschlagt hat.
Da die Basis Konfig aber vom Shop fest/ ausgelegt war und ich extra noch das damals leistungsstärkste Netzteil ausgesucht hatte, bin ich damals von der Richtigkeit der Hardware-Konfig ausgegangen.

Weiss momentan nicht, was ich machen soll - zurückschicken, mit dem Verweiss, dass das Netzteil zu schwach ist oder mir privat nen neues Netzteil zu suchen? Falls es nämlich doch nicht das Netzteil ist und ich dannschon rumgebastellt habe.... - wegenGarantie.

Ich brauch den PC eigentlich zum Arbeiten und wenn er zurückgeht, ist er bestimmt auch mehrere Wochen weg. Und wie lange dort die Bestellung neuer Komponenten braucht, ist wieder ne andere Frage.:cautious::unsure:

Danke

P.S: Hab mal die alten Dumps hochgeladen. Sollten welche ohne Prime dabei sein.
 

Anhänge

  • old_dumps.rar
    957 KB · Aufrufe: 91
Zuletzt bearbeitet:
fffff803`81bf0000 fffff803`81bfa000 SymELAM.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000A000
Eerst mal Norton deinstallieren.
Reste des Programm mit dem Entfernungstool beseitigen.
Nur den Windows Defender benutzen.
Dann abwarten ob es noch mal zum blue screen kommt?
 
Was verstehst du unter Bios ist gebrandet? Das ist ein stinknormales MSI Unify.
Ich hätte dafür ein Godlike oder Aorus Extreme genommen, egal.
 
Bios ist mit dem Logo des Händlers versehen.
Ich hatten meinen letzten PC vor 10 Jahren komplett zusammnegbaut.
Mittlerweile habe ich aber weder die Zeit, vorallem noch das Interesse zum Rumbasteln und deswegen bin ich was Hardware betrifft auch völlig "out of date" und habe seither nur noch Komplettsysteme genommen.
 
Zuletzt bearbeitet von einem Moderator:
Die haben einfach eine PNG in den Bootscreen eingebaut. Das hat mit gebrandet nichts zu tun. Stell dir einfach vor du hättest eine RX 6000er Grafik. Dafür müßtest du auch das aktuellste Bios A80 ( jetzt Version A93 ) einspielen. Derzeit bist du 6 Versionen zurück.
Netzteil dasselbe. Wenn deins nicht reicht, willst du wirklich zwei Jahre warten , das die Gewährleistung vorbei ist?
Ob du jetzt etwas adäquates bekommst ist sowieso nicht gesagt. Irgendwie ist der Markt ziemlich ausgekehrt.
 
Netzteil dasselbe. Wenn deins nicht reicht, willst du wirklich zwei Jahre warten , das die Gewährleistung vorbei ist?
Ne natürlich nicht. Ich wollte nur erst klären an was es liegen könnte, bevor der PC wieder zurück muss.
Zumindest liegt es nahe, dass das Netzteil nicht ausreicht. Was mir auch argumentativ hilft um dem üblichen Standard-Geschwurbel seitens des Herstellers aus dem Weg zu gehen.
 
Dumpfiles: 9625
APC_INDEX_MISMATCH (1) Asyncroner Prozeduraufruf - hier des Kernels
PROCESS_NAME: EpicGamesLauncher.exe
IMAGE_NAME: ntkrnlmp.exe
FAILURE_BUCKET_ID: 0x1_SysCallNum_4_nt!KiSystemServiceExitPico

Speicher steht auch hier mit 3000MHz
Beispiel:
Modul Ironx64.sys Norton - Symantec
IDSvia64.sys Norton Internet Security
SymElam.sys Norton Security Premium in den entladenen Modulen

Komponenten des Chipsatztreiberpaketes fehlen. Modulliste nur mal kurz überflogen.

Dumpfile 9968
KERNEL_SECURITY_CHECK_FAILURE (139)
A kernel component has corrupted a critical data structure. The corruption
could potentially allow a malicious user to gain control of this machine
PROCESS_NAME: System
IMAGE_NAME: ntkrnlmp.exe
FAILURE_BUCKET_ID: 0x139_0_LEGACY_GS_VIOLATION_STACKPTR_ERROR_nt!guard_icall_handler

Wenn du Ryzen Master benutzt dann nur als zeitweiligen Monitor. Nicht permanent und auch nicht um Prozessoreinstellungen unter windows zu setzen. Das gehört ins Bios, egal was irgendwelche Zeitschriften irgendwann einmal geschrieben haben. Vor allem sollte der dann aktuell sein.
Auch hier fehlen Teile des Chipsatzpaketes. Den Rest spar ich mir. Wird nicht viel anders sein wenn alle vom 21.04. 21 sind.

Also Bios auf A93 ,auch wenn das Betastatus haben sollte. Chipsatztreiber von AMD laden und installieren.
Schnellstart aus, automatischen Neustart deaktivieren, Fastboot wenn aktiv im Bios abschalten
Nach Biosupdate gehst du (F1) ins Bios zurück und mußt deine einstellungen wiederherstellen. Also merken, oder aufschreiben oder Bild machen. Für den Ram XMP aktivieren. MSI kenn ich die Oberfläche nicht genau , also Handbuch lesen. Auch für die Einstellungen der Lüfter und deren Zuordnung zu den Sensoren . Wenn es das gibt.
 
Zuletzt bearbeitet:
Ich habe mal alle hier aufgeführten Schritte durchgemacht:

- Alle Monitoring-Tuning Tools/ restlichen AV Tools runtergeschmissen.
- Im StartUp alles was möglich war rausgeschmissen und die neusten Treiber/Win Updates drauf.
- Bios Settings geändert (siehe Post von Mark O).
- Schnellstart gibt es bei meinem Win nicht - habe dort nur die Option "Sperren" + "Energie sparen"


Blue Screens haben, bis jetzt, gefühlt nach dem aufräumen im Autostart vorerst aufgehört
Bis jetzt keine BSODs mehr - allerdings war Unreal (RTX Level) auch nur kurz auf um das langfristig unter Volllast beurteilen zu können.

Werde dann wohl morgen das Bios updaten:

Muss ich hier von allen Einstellungen und Sub-Menus Screens machen oder nur vom OC Bereich?
Kann man die alten Einstellungen dann wieder laden oder besser per Hand ändern?


Danke
 
Zuletzt bearbeitet:

das kannst du nach dem BIOS Update wiederholen, die (und alle anderen) Einstellungen sind dann weg

nach dem BIOS Update mußt du die Setup Defaults laden und speichern, erst danach kannst du die perönlichen individuellen Einstellungen vornehmen, die du dir hoffentlich vorher notiert hast


Schnellstart gibt es bei meinem Win nicht - habe dort nur die Option "Sperren" + "Energie sparen"

das und auch Ryzen balanced wird erst angeboten, wenn der AMD Chipsatztreiber komplett im System verankert ist
 
@Mark O.
- "Ryzen Balanced" ist aktiviert - nur habe ich keine Schnellstart Option (mehr).
94rRwZPVII.png

- Mit dem Bios meinte ich eher - soll ich mir jetzt ALLE Bios Einstellungen notieren (Händler hat das das Bios eingerichtet - keine Ahnung was der gemacht hat) oder nach dem Update nur die Default Werte + deine Änderung (über)nehmen und das System damit laufen lassen?

A) Bios Einstellung vom Händler nachtragen + deine Einstellungen?

B) Default Einstellungen + deine Einstellungen?
 
Zuletzt bearbeitet von einem Moderator:
Anzeige
Oben