Anzeige

Am Puls von Microsoft

Anzeige

[gelöst] whea_uncorrectable_error bei div. Spielen

dramatic91

Herzlich willkommen
Hallo liebes Forum

Ich wende mich hier völlig verzweifelt an euch, da ich seit längerer Zeit nun ein Problem habe, dass ich einfach nicht lösen kann:

Bei diversen Spielen stürzt bei mir nach einiger Zeit der PC komplett ab mit einem Bluescreen. Ich habe online keine Lösungen gefunden die mir bei meinem Problem helfen würden und hoffe nun meine Berichte könnten wenigstens darauf hinweisen, wo der Fehler liegen könnte.

Der Fehler tritt unregelmässig auf! Teilweise nach 2h, teilweise nach 30min. Und auch nicht bei allen Spielen, sondern nur bei einigen. Ich habe jetzt immer die Temperatur von Motherboard (~25-28°C) sowie CPU (45-65°C) überwacht und daran scheint es nicht zu liegen. Ausserdem habe ich den PC stets komplett gesäubert gehalten dürfte also auch kein Einfluss von Staub o.ä. sein.

Ich habe die Berichte der letzten zwei Meldungen von "BlueScreenView" im Archiv angehängt und hoffe jemand kann mir helfen. Falls zusätzliche Informationen benötigt werden, lasst es mich bitte wissen!

Bereits im voraus möchte ich mich herzlich bedanken und wünsche einen schönen Sonntag.

dramatic91
 

Anhänge

  • 102316-4562&4890.rar
    133,9 KB · Aufrufe: 230
Anzeige
Hallo @dramatic91! Willkommen im Forum! :)
Ich habe die Dumpfiles mit dem Debugger betrachtet. Beide Abstürze beruhen auf dem gleichen Fehler: Cache-Fehler des Prozessors.
Als erstes den Debuggerlauf (auszugsweise).
102316-4890-01.dmp
Code:
WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
[COLOR="#FF0000"]Arg2: ffff970255b18028[/COLOR], Address of the WHEA_ERROR_RECORD structure.
[COLOR="#008000"]Der Fehler wurde beim Machinencheck festgestellt Parameter 1 = 0 ) 
und ist in Parameter 2 gespeichert[/COLOR]
Arg3: 00000000bf800000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000124, Low order 32-bits of the MCi_STATUS value.
.....
PROCESS_NAME:  AISuite3.exe
[COLOR="#008000"]Die Asus-Suite war am Fehler beteiligt[/COLOR]

STACK_TEXT:  
fffff803`ba5cda38 fffff803`b843e27f : 00000000`00000124 00000000`00000000 ffff9702`55b18028 00000000`bf800000 : nt!KeBugCheckEx
fffff803`ba5cda40 fffff803`b86a73b4 : ffff9702`55b18028 ffff9702`55bf0af0 ffff9702`55bf0af0 ffff9702`55bf0af0 : hal!HalBugCheckSystem+0xcf
[COLOR="#FF0000"]fffff803`ba5cda80 fffff803`b843e76c : 00000000`00000728 00000000`00000000 fffff803`ba5cde70 00000000`00000000 : nt!WheaReportHwError+0x258[/COLOR]
[COLOR="#008000"]Hier wird der Erroreport geschrieben und die weitere Bearbeitung
an BugCheckEx übergeben. Das Sytem stürzt ab.[/COLOR]
fffff803`ba5cdae0 fffff803`b843eac4 : ffff9702`00000010 ffff9702`55bf0af0 fffff803`ba5cdc88 ffff9702`55bf0af0 : hal!HalpMcaReportError+0x50
fffff803`ba5cdc30 fffff803`b843e9ae : ffff9702`554d8b20 00000000`00000001 00000000`00000000 00000000`00000000 : hal!HalpMceHandlerCore+0xe8
fffff803`ba5cdc80 fffff803`b843ebee : 00000000`00000008 00000000`00000001 00000000`00000000 00000000`00000000 : hal!HalpMceHandler+0xda
fffff803`ba5cdcc0 fffff803`b843ed70 : ffff9702`554d8b20 fffff803`ba5cdef0 00000000`00000000 00000000`00000000 : hal!HalpMceHandlerWithRendezvous+0xce
fffff803`ba5cdcf0 fffff803`b85d11fb : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : hal!HalHandleMcheck+0x40
fffff803`ba5cdd20 fffff803`b85d0f84 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KxMcheckAbort+0x7b
fffff803`ba5cde60 ffff8dd8`1ff40506 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiMcheckAbort+0x184
[COLOR="#008000"]Dabei wurde durch den Machinencheck ein Abort veranlasst.[/COLOR]
[COLOR="#FF0000"]ffffbe80`77dc6498 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : win32kfull!memcpy+0x246[/COLOR]
[COLOR="#008000"]Zu Beginn des Stack werden Daten aus den Memory copiert und 
sollen an den DatenCache übergeben werden.[/COLOR]
,....
FAILURE_BUCKET_ID:  MEMORY_CORRUPTION_ONE_BIT

[COLOR="#FF0000"]BUCKET_ID:  MEMORY_CORRUPTION_ONE_BIT[/COLOR]
....
0: kd> !errrec ffff970255b18028
===============================================================================
Common Platform Error Record @ ffff970255b18028
-------------------------------------------------------------------------------
Record Id     : 01d22d16d8c9053b
Severity      : Fatal (1)
Length        : 928
Creator       : Microsoft
[COLOR="#FF0000"]Notify Type   : Machine Check Exception[/COLOR]
Timestamp     : 10/23/2016 10:35:35 (UTC)
Flags         : 0x00000000

===============================================================================
Section 0     : Processor Generic
-------------------------------------------------------------------------------
Descriptor    @ ffff970255b180a8
Section       @ ffff970255b18180
Offset        : 344
Length        : 192
Flags         : 0x00000001 Primary
Severity      : Fatal

Proc. Type    : x86/x64
Instr. Set    : x64
Error Type    : Cache error
[COLOR="#FF0000"]Operation     : Generic[/COLOR]
Flags         : 0x00
Level         : 0
CPU Version   : 0x00000000000306c3
Processor ID  : 0x0000000000000000

===============================================================================
Section 1     : x86/x64 Processor Specific
-------------------------------------------------------------------------------
Descriptor    @ ffff970255b180f0
Section       @ ffff970255b18240
Offset        : 536
Length        : 128
Flags         : 0x00000000
Severity      : Fatal

Local APIC Id : 0x0000000000000000
CPU Id        : c3 06 03 00 00 08 10 00 - ff fb fa 7f ff fb eb bf
                00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00
                00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00

Proc. Info 0  @ ffff970255b18240

===============================================================================
Section 2     : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor    @ ffff970255b18138
Section       @ ffff970255b182c0
Offset        : 664
Length        : 264
Flags         : 0x00000000
Severity      : Fatal

[COLOR="#FF0000"]Error         : DCACHEL0_WR_ERR (Proc 0 Bank 1)[/COLOR]
  Status      : 0xbf80000000000124
  Address     : 0x00000004079f6100
  Misc.       : 0x0000000000000086  
[COLOR="#008000"]Beim Schreiben (WR) in den Datencache trat ein Fehler auf. [/COLOR]
Zum Zeitpunkt des Absturzes war PROCESS_NAME: AISuite3.exe aktiv. Ob diese Suite allerdings den Datentransfer veranlasst hat, konnte ich nicht feststellen.

Meine Schlussfolgerung:
Der Datencache-Fehler ist normalerweise ein ernster Fehler und deutet häufig auf defekte CPU oder Übertaktung oder Spannungsunterversorgung hin. Manchmal konnte dieser Fehler auch durch eine BIOS-Update behoben werden. Das dürfte aber in diesem Fall nicht zutreffen, da das BIOS sehr neu ist.
-> Vorschlag: den BoostModus der CPU zurück nehmen. Die CPU ist zwar zum Übertakten geeignet, aber es gibt Produktionsfehler, die dann eben eine Übertaktung nicht vertragen.

Wenn die Daten, die in den Cache geschrieben werden sollen, aus dem Memory gelesen wurden und dieser Speicherbereich ist fehlerhaft, kann natürlich beim Schreiben in den Cache der Fehler auftreten. Für einen Speicherfehler würde die folgende Ausgabe des Debuggers sprechen: BUCKET_ID: MEMORY_CORRUPTION_ONE_BIT
-> Überprüfung des RAM mit Memtest86+ http://www.drwindows.de/hardware-to...rbeitsspeicher-diagnose-fuer-windows-pcs.html
-> sollte der Memtest86+ aufgrund des UEFI nicht richtig laufen, kann der Passmark Memtest verwendet werden
PassMark MemTest86 - Memory Diagnostic Tool - Technical Information
 
Hallo Ari45

Vielen Dank für die Begrüssung und die ausführliche Analyse meiner Logfiles.

Der Prozess "AISuite3.exe" wird ziemlich sicher nicht der Auslöser gewesene sein, das ist die ASUS Suite zur Überwachung der Temperaturen und ähnliches - habe ich heute installiert, der Fehler bestand jedoch schon zuvor.. Viel eher denke ich, dass (zumindest im zweiten Fall) Battlefield1 der Auslöser hätte sein müssen.

BIOS-Update habe ich heute gemacht mit dem Orignialfile der Herstellerseite (Asus). Deswegen wird es sehr neu sein.

Den Boost habe ich rausgenommen - bzw. auf Standart zurückgesetzt.

Memtest bin ich zu diesem Zeitpunkt am durchlaufen lassen. Falls dort noch Files gebraucht werden werde ich die nach dem Durchgang anhängen.

Wäre also nicht auszuschliessen, dass es ein Hardwaredefekt ist? Wenn ich doch zumindest wüsste, welche Hardware es betrifft könnte man doch diese ersetzen oder? :(

Update: MemTest zeigt nach gut 30Minuten Laufzeit (8 offene Fenster à je 2047mb RAM) keinerlei Errors an.
 
Zuletzt bearbeitet:
Guten Morgen!
Der Memtest86+ wird doch beim Booten ausgeführt. Da können doch noch keine Fenster offen sein. Das ist extra so programmiert, damit der RAM leer ist und voll getestet werden kann.
Außerdem können nie alle 8 bzw 10 Testmodi durchgelaufen sein und es sollten mindestens 3 komplette Durchläufe gemacht werden. Bei 16 GB RAM wird das so um die 3 1/2 Stunden dauern.
 
Guten Morgen ebenso.

Oh, dann habe ich wohl (vorgängig vor deinem Post!) ein Programm geladen, welches MemTest heisst und mich ein bisschen falsch informiert hat. Bzw. wenn ich es starte geht ein Fenster auf mit der Anzahl Ram die ich eingeben kann und die dann getestet wird. Auch steht da, dass 20min. Mindestlaufzeit empfohlen sind...

War wohl dann ein falsches Programm ;) Ich werde nach meiner Rückkehr in 3 Tagen den Test laufen lassen den du empfohlen hast, bis dahin danke ich schon einmal für die Aufklärung.

Ich werde updaten sobald ich soweit bin.

Lg dramatic91
 
@dramatic91!
Ich würde empfehlen, dass du es erst mit Memtest86+ versuchst. Wenn du auf der Homepage von Memtest.org bist, scrollst du nach unten bis zum Downloadbereich.
Dort würde ich dann den Download für den USB-Stick verwenden, da verprutzelt man keine CD.
Memtest86+_Download.jpg
Und wie gesagt, mindestens drei Durchgänge laufen lassen, d.h. bis Pass = 2 und Pass% = 100% ist.
IMG_0002_markiert.jpg
Achso, sobald Fehler auftreten (rote Markierungen im Fenstermittelteil) kann mit >ESC< abgebrochen werden. Dann sollten die Riegel einzeln getestet werden.
IMG_0011.jpg
 
Hallo Ari45

Mit Freuden darf ich verkünden, dass mein Problem sich scheinbar wie von Zauberhand in Luft aufgelöst hat... Naja nicht ganz aber so ähnlich.

Jedenfalls habe ich wie erwähnt den Boost Modus rausgenommen bzw. im Bios Standard-Einstellungen wiederhergestellt.
Ich denke dadurch hat sich das Problem gelöst... Nebenbei habe ich noch die SSD ersetzt (Da ich unvorsichtig war und mir die Kontakte abgebrochen sind bei meiner alten ;)). Ansonsten habe ich an der Hardware nichts geändert. Jedenfalls habe ich heute ca. 6h lang durchgehend Battlefield1 gespielt was sonst bei mir nach spätestens 1,5-2h zu abstürzen / bluescreens geführt hat.

Ich bedanke mich jedenfalls ganz herzlich für die Hilfe und betrachte mein Problem somit als gelöst.
 
@dramatic91, es wäre ja erfreulich, wenn sich dein Problem durch zurücksetzen des BIOS gelöst hätte.
Teste noch eine Tag und wenn alles läuft, setze bitte dieses Thema unter dem letzten Beitrag auf gelöst.
So wird die Lösung auch von außerhalb mit Suchmaschinen besser gefunden.
 
Klasse und Dank an Aribert
@dramatic91
Bedenke immer:
Overclocking geht, aber
Zum einen muß man sehr genaue Fachkenntnisse haben, um das stabil hinzukriegen.
Zum anderen 2 bis 3 Hundert MHz mehr machen normalerweise den Kohl auch nicht fett.
Desweiteren muß bei höherem Übertakten die Hardware nicht nur 100%ig in Ordnung sein,
sondern schon 1000%ig...;) jedoch um so instabiler wird das Ganze dann.
Mal abgesehen davon... Eine sehr gute Kühlung und ein sehr gutes Netzteil sind dann auch hilfreich!
 
Anzeige
Oben