Anzeige

Am Puls von Microsoft

Anzeige

Frage Pc verabschiedet sich auf mehrere weisen

Stivus

Herzlich willkommen
Hallo Leute:

Ab und zu habe ich das Problem das sich mein Pc auf verschiedene arten verabschiedet.

Varianten:
1. Schwarzer Bildschirm während dem Spielen Pc läuft weiter aber kein Sound , muss neustart machen.
2. Blue Screen mit Fehler Meldung: whea_uncorrectable_error---> Minidump datei wurde erstellt
3. Pc macht einfach einen Neustart

Woran kann das Liegen??

Mein System:

Win10 64 Bit
Intel Core i7-4770K CPU 3,50GHz
16GB Ram
NVIDIA GTX 980 4Gb
MSI Mainboard Z87-GD65 Gaming
Netzteil MS Tech 950 Silent
Samsung Evo SSD 256gb

Im anhang is die Minidump Datei falls sie hilft.

Vielen dank im Voraus für eure Hilfe.
 

Anhänge

  • 032016-28265-01.rar
    26,6 KB · Aufrufe: 106
Anzeige
Hallo Stivus!


Mit der grundlegenden Information hat .Bernd Dich bereits versorgt.
Der kausal aufgegliederte Verlauf folgt ...

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: ffffe0005ec70028, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000bf800000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000124, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------

BUGCHECK_STR: 0x124_GenuineIntel <- Als letzte bekannte Quelle ohne Rückmeldung referenziert (Prozessor)

CUSTOMER_CRASH_COUNT: 1

DEFAULT_BUCKET_ID: WIN8_DRIVER_FAULT

PROCESS_NAME: bf4.exe

CURRENT_IRQL: f <- Ausgabe- oder Engabefehler von einem Gerät am Prozessor-APIC verursacht (bspw. keine Rückmeldung)

STACK_TEXT:
ffffd001`e0a8a6f8 fffff801`f3e9e94f : 00000000`00000124 00000000`00000000 ffffe000`5ec70028 00000000`bf800000 : nt!KeBugCheckEx
ffffd001`e0a8a700 fffff801`f386a374 : ffffe000`5ec70028 ffffe000`5de95850 ffffe000`5de95850 ffffe000`5de95850 : hal!HalBugCheckSystem+0xcf <- Treiber referenziert inkorrekten Speicherpool (Cache von Prozessor, Datenträger oder sonstiger Gerätschaft sowie Puffer auf Datenträger oder Arbeitsspeicher - weiter zu 0x50)
ffffd001`e0a8a740 fffff801`f3e9ee3c : 00000000`00000728 00000000`00000006 ffffd001`e0a8ab30 00000000`00000000 : nt!WheaReportHwError+0x258 <- Fehler in der Energieversorgung oder -Verwaltung des unbekannten Treibers autorisiert
ffffd001`e0a8a7a0 fffff801`f3e9f19c : ffffe000`00000010 ffffe000`5de95850 ffffd001`e0a8a948 ffffe000`5de95850 : hal!HalpMcaReportError+0x50 <- Übertritt des Adressraumes am Puffern des besagten Treibers (Wirkung von 0xcf)
ffffd001`e0a8a8f0 fffff801`f3e9f088 : ffffe000`5de94f60 00000000`00000001 00000000`00000006 00000000`00000000 : hal!HalpMceHandlerCore+0xe8 <- Benutzereingabe bzw. Einforderung des jeweiligen Treibers fehlgeschlagen (Treiber wird im Benutzermodus ausgeführt - UMDF)
ffffd001`e0a8a940 fffff801`f3e9f2c6 : 00000000`00000008 00000000`00000001 00000000`00000000 00000000`00000000 : hal!HalpMceHandler+0xe4 <- Datenintegritätsfehler während der Übergabe der Instruktion des unbekannten Benutzermodustreibers festgestellt
ffffd001`e0a8a980 fffff801`f3e9f450 : ffffe000`5de94f60 ffffd001`e0a8abb0 00000000`00000000 00000000`00000000 : hal!HalpMceHandlerWithRendezvous+0xce <- Operation zum Abschluss der Befehlsübergabe des Benutzermodustreibers ausstehend
ffffd001`e0a8a9b0 fffff801`f376fe7b : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : hal!HalHandleMcheck+0x40 <- Der Adressraum von einer physikalischen Speichereinheit (Speicherzelle) ist zu klein (die Clustergröße ist ungültig)
ffffd001`e0a8a9e0 fffff801`f376fc31 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KxMcheckAbort+0x7b <- Windows kann das Gerät zum Puffern (Systemdatenträger ???) nicht verifizieren (s. CURRENT_IRQL)- Prozessor-APIC ausgefallen (s. BUGCHECK_STR)
ffffd001`e0a8ab20 00000001`4075d901 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiMcheckAbort+0x171 <- Der Timeout infolge von 0x7b (Betriebssystem aufgehangen)
00000000`4c9697c8 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x1`4075d901


STACK_COMMAND: kb

FOLLOWUP_NAME: MachineOwner

MODULE_NAME: GenuineIntel

IMAGE_NAME: GenuineIntel

DEBUG_FLR_IMAGE_TIMESTAMP: 0

FAILURE_BUCKET_ID: X64_0x124_GenuineIntel_PROCESSOR_CACHE

BUCKET_ID: X64_0x124_GenuineIntel_PROCESSOR_CACHE

Followup: MachineOwner

Es ist festzuhalten, dass sich etliche Übergabefehler von einem Benutzermodustreiber im Prozessor-Cache ereigneten mit maßgeblichen Einfluss auf das Power-State des Prozessors.

Des Weiteren ist der Fehlerverlauf in der Virtuellen Maschine (Prozessor-Instanz) der Hardwareabstraktionsschicht zu verzeichnen, sodass das Betriebssystem als Ursache ausscheidet und demzufolge einzig von dem Gerätefehler in der Kommunikation von dem besagten Treiber ausgegangen werden darf.

Der Prozessor ist zwar die Fehlerquelle, aus Sicht der Wirkung betrachtend, doch die Ursache - der Benutzermodustreiber, welcher der Anfang allen Übels ist, ist unbekannt.

Was ich anraten kann ist ... Den Chipsatztreiber und auch zugleich den Grafiktreiber zu aktualisieren, denn ein UMDF-Treiber mit [scheinbarem] Zugang auf das Energieschema des Prozessors ist der Chipsatztreiber mit Funktion über den System Management Bus von Intel (I/O Controller Hub - ICH oder Platform Controller Hub - PCH), welcher für die Energierichtlinie und für die Energieverwaltung von Windows (APM, ACPI) zuständig ist.
 
Zuletzt bearbeitet:
Guten Morgen @Stivus! Willkommen im Forum! :)
Die wichtigste Aussage der Dumpfile ist, dass ein WHEA-Record gespeichert wurde. In dem ist der Hardwarefehler dokumentiert.
===============================================================================
Common Platform Error Record @ ffffe0005ec70028
-------------------------------------------------------------------------------
Record Id : 01d1815cbec3a36b
Severity : Fatal (1)
Length : 928
Creator : Microsoft
Notify Type : Machine Check Exception
Timestamp : 3/20/2016 17:08:48 (UTC)
Flags : 0x00000000

===============================================================================
Section 0 : Processor Generic
-------------------------------------------------------------------------------
Descriptor @ ffffe0005ec700a8
Section @ ffffe0005ec70180
Offset : 344
Length : 192
Flags : 0x00000001 Primary
Severity : Fatal

Proc. Type : x86/x64
Instr. Set : x64
Error Type : Cache error
Operation : Generic
Flags : 0x00
Level : 0
CPU Version : 0x00000000000306c3
Processor ID : 0x0000000000000006

===============================================================================
Section 1 : x86/x64 Processor Specific
-------------------------------------------------------------------------------
Descriptor @ ffffe0005ec700f0
Section @ ffffe0005ec70240
Offset : 536
Length : 128
Flags : 0x00000000
Severity : Fatal

Local APIC Id : 0x0000000000000006
CPU Id : c3 06 03 00 00 08 10 06 - bf fb da 7f ff fb eb bf
00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00

Proc. Info 0 @ ffffe0005ec70240

===============================================================================
Section 2 : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor @ ffffe0005ec70138
Section @ ffffe0005ec702c0
Offset : 664
Length : 264
Flags : 0x00000000
Severity : Fatal

Error : DCACHEL0_WR_ERR (Proc 6 Bank 1)
Status : 0xbf80000000000124
Address : 0x00000001311989c0
Misc. : 0x0000000000000086
Es ist ein Schreibfehler im L0-Cache des Prozessors (Core) 6 aufgetreten. Wahrscheinlich kamen die Daten aus dem RAM in Bank 1.
Der L0-Cache ist nicht bei allen CPU vorhanden und dient zur Spiegelung der Daten aus dem L1-Cache (für doppelte Sicherheit).
Dieser Fehler kann sein:
-> ein Ansteuerfehler durch den Chipsatz --> Chipsatztreiber updaten
-> eventuell Übertaktung --> ist bei dir nicht der Fall, habe ich überprüft
-> ein Fehler im BIOS --> eventuell BIOS-Update besorgen
-> nicht zuletzt kann es ein fehlerhafter RAM sein --> Memtest86+ mindestens 3 komplette Durchläufe machen lassen

Im Folgenden gebe ich noch die ausgelesenen Werte des BIOS wieder. Das soll dir bei der Suche nach einem BIOS-Update helfen. Da das BIOS vom OEM modifiziert wurde, darf man ein mögliches Update nur beim Motherboard-Hersteller beziehen.
Machine ID Information [From Smbios 2.7, DMIVersion 0, Size=2860]
BiosMajorRelease = 4
BiosMinorRelease = 6
BiosVendor = American Megatrends Inc.
BiosVersion = V1.3
BiosReleaseDate = 06/17/2013

SystemManufacturer = MSI
SystemProductName = MS-7845
SystemFamily = To be filled by O.E.M.
SystemVersion = 1.0
SystemSKU = To be filled by O.E.M.
BaseBoardManufacturer = MSI
BaseBoardProduct = Z87-GD65 GAMING (MS-7845)

BaseBoardVersion = 1.0

Noch ein kleiner Hinweis, wo ich nicht sicher bin, ob er nicht doch etwas mit dem Problem zu tun hat:
Zum Zeitpunkt des Crasch war der Prozess PROCESS_NAME: bf4.exe aktiv. Hast du zu der Zeit Battlefield 4 gespielt? Da die Treiber von Spielen sehr tief ins System eingreifen, solltest du auch man beim Spielehersteller nach einem Patch Ausschau halten.
 
Moin KnSN!
ot:
Ja, mit dem Windows 10 Debugger unter Windows 10. Ich habe in der Vergangenheit festgestellt, dass beim Debuggen von Windows 10-Dumpfiles unter Windows 10 teils konkretere und teils ausführlichere Daten geliefert werden.
Zu dem Battlefield mußte ich es als Frage formulieren, weil ich nicht spiele, höchsten mal ein Solitär oder einen Skat.
 
Hallo an alle und erst mall vielen dank für eure Hilfe.

@Ari45: Ja ich habe zu diesem Zeitpunkt Bf4 gespielt.

Desweiteren habe ich euch noch mall eine Minidump Datei da ich eigentlich gestern Abend noch ein Update Laden wollte von TESO(The Elder Scrolls Online) und als ich vor dem Bett gehen noch schnell nach dem Stand der dinge geschaut habe musste ich feststellen das Schon wieder der Fehler aufgetretten ist. Vlt sagt diese Datei auch noch was aus woran es Liegt. Werde jetzt auch erst mall nach denn Updates schaun.
 

Anhänge

  • 032016-26234-01.rar
    29,7 KB · Aufrufe: 79
Hallo Stivus und danke!


Der Fehler ist derselbe.
Da ich nicht die Parameter auswerten kann, kann ich Dir nicht bestätigen, ob der Fehler abermals am L0-Cache aufgetreten ist.
Fehler im IMC weisen aber zumeist daraufhin, dass der Prozessor fehlerhaft arbeitet.

Das kann durch eine Übertaktung passieren, das kann ebenso nach dem Erwerb eines sogenannten Tray-Prozessors auftreten, des Weiteren ist die Überhitzung des Prozessors ein weiterer Indikator.


Bitte poste die Temperaturen und sonstige Werte zu Deinem Computer!
http://www.drwindows.de/hardware-tools/38744-hwmonitor-hardware-monitor.html

Bitte von CPU-Z je einen Screenshot von den Reitern CPU, Mainboard, Memory und *SPD anhängen!
http://www.drwindows.de/hardware-tools/34371-cpu-z-hardwareinformationen-anzeigen.html
* Bei uneinheitlicher Bestückung von Speichermodulen bitte je einen Screenshot pro Steckplatz anhängen; umschaltbar über die Schaltfläche "Memory Slot Selection"![/QUOTE]


Wie schaut es um die Kühlung von Prozessor und sonstigem aus?
Aktualisiere zuerst einmal den Chipsatztreiber!
 
Bei einem ersten Überblick mit dem Debugger von Windows 8 ist der gleiche Fehler WHEA-Error aufgetreten.
Ich sehe mir das noch mal mit dem Debugger von Windows 10 an. Melde mich in 10 oder 15 Minuten noch mal. Muß das System erst starten.
 
Danke KnSN.

Hab über mein Gerätemanager versucht die Prozessoren zu Aktualisieren sind aber auf den Neuesten stand sowie auch die Grafikkarte.

Hier die Screenshots (Hoffe man kann alles Erkennen da ich leider nicht weiß wie ich nur ein Bildschirm Screenshot machen kann. :/ )
 

Anhänge

  • Ersterteil Hardware Monitor.png
    Ersterteil Hardware Monitor.png
    189,9 KB · Aufrufe: 135
  • SPD.png
    SPD.png
    230,4 KB · Aufrufe: 132
  • CPU.png
    CPU.png
    251,3 KB · Aufrufe: 124
  • Mainboard.png
    Mainboard.png
    239,3 KB · Aufrufe: 152
  • Memory.png
    Memory.png
    241,8 KB · Aufrufe: 111
Danke!

Bitte setze den Prozessor via Prime95 für Minuten unter Last, denn die Werte - siehe HWMonitor - sind so ohne Weiteres nicht nachvollziehbar.

Orientiere Dich an der Einstellung, so wie im Screenshot (FFTs in-place und FFT size min. sowie FFT size max. 1344)!

attachment.php


Zeichne nach wenigen Minuten einen neuen Screen von HWMonitor auf - nur von dem oberen Bereich, welcher die Werte für Prozessor, Mainboard und Arbeitsspeicher umfasst!

Wiederhole den Durchlauf via Prime95 mit FFTs in-place und FFT size min. 8 sowie FFT size max. 4096!

attachment.php


Erfasse ebenso einen Screenshot von Prime95 im Vollbild mit Einblick auf allen Threads, sodass Fehler der einzelnen Prozessorkerne nachvollziehbar sind!
 

Anhänge

  • Prime95.PNG
    Prime95.PNG
    135,3 KB · Aufrufe: 272
  • Prime95.PNG
    Prime95.PNG
    141,8 KB · Aufrufe: 302
So, da bin ich wieder. Es hat etwas länger gedauert, weil ich noch versucht habe, etwas tiefer in die Dump-Informationen ein zu dringen. Ist mir aber nicht gelungen, wegen "Machine Check feature not present", also die detaillierten MCA-Informationen sind nicht verfügbar..
Da der Crash-Code der gleiche ist, gebe ich nur die Sektion 2 der Error-Record wieder:
===============================================================================
Section 2 : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor @ ffffe000a36b4138
Section @ ffffe000a36b42c0
Offset : 664
Length : 264
Flags : 0x00000000
Severity : Fatal

Error : DCACHEL0_WR_ERR (Proc 7 Bank 1)
Status : 0xbf80000000000124
Address : 0x00000003af5af100
Misc. : 0x0000000000000086
In der Auswertung in #4 war der beteiligte Prozessor(Kern) Proc 6, dieses Mal ist der Proc 7 beteiligt. Deshalb nehme ich ganz stark an, dass es kein defekter Prozessor ist, denn dann müsste Proc immer gleich sein.
Es ist also ein Treiber oder eine unverträgliche Software.
Wenn du alles probiert hast, was ich in #4 empfohlen habe, könntest du noch versuchen, im BIOS die VCore um 0,005 oder 0,01V zu erhöhen. Das hat neulich bei einem ähnlichen Fehler geholfen.
 
Danke Ari45!


Laut Deiner Analyse lohnt Prime95 nicht?
Wie werden die Threads von Intel-Prozessoren in Prime95 aufgegliedert?
Je ein Based-Cluster (Prozessorkern) und darunter je ein Shared-Cluster (HT-Thread) oder erst alle 4 Based-Cluster und wiederum darunter in Reihe die Shared-Cluster?

Wenn es so ist, wie ich es vermute, dann folgt nach jedem Integer-Core ein HT-Thread, und dann ist lediglich Processor 7 ein physikalischer Cluster.
 
So hab das gemacht was du Vorgeschlagen hast KnSN aber leider hatt sich sofort Mein PC in beiden Varianten sofort Verabschiedet.
Beim ersten Versuch kam ein Bluescreen mit der Meldung: CLOCK_WATCHDOG_TIMEOUT aber der Fehlerspeicher Prozess ging nur bis 50% also leider keine Datei zum einsehen.
Beim zweiten Versuch wurden meine beiden Monitore Schwarz und nix mehr ging.

Kann also keine Screens Liefern :(

@ Ari45: Ich möchte nicht umbedingt im BIOS rumhantieren weil ich da keine erfahrung mit habe.


Zur info: Habe jetzt ca ne Stunde BF4 gespielt und hatte keine Probleme.
 
Bug Check 0x101: CLOCK_WATCHDOG_TIMEOUT

Zeitüberschreitung in der Unterbrechungsanforderung am Prozessor (Advanced Programmable Interrupt Controller - APIC) durch ungleichem Taktsignal mit bspw. den Arbeitsspeicher auf unspezifischer Norm von bspw. 213 MHz mal dem DRAM-Teiler zum integrierten Speichercontroller des Prozessors (Integrated Memory Controller – IMC).
Die Zwischenschaltung von DRAM zu CPU ist auf Deinem Mainboard der Intel QuickPath Interconnect - QPI (ehemals Uncore und Front Side Bus).

Durch Übertaktungen kenne ich diesen Bug in der Wechselwirkung zu FSA_STS_ECM_ERROR wegen Phasenverschiebung (Emission Phase Coherency) am ECM-Burst (Intel QuickPath Interconnect): Das bedeutet die Instabilität in der Versorgungsspannung des Prozessors seitens dem Spannungsreglermodul.

Ein weiterer Indikator, als die Übertaktung, zu dieser Phasenverschiebung ist die sogenannte Rückwärtsspannung, ergo der Übertritt des maximalen Schwellenwertes für die Spitzensperrspannung (Peak Reverse Voltage) am Spannungsreglermodul (Voltage Regulator Module) des Mainboards zum Prozessor oder des Netzteils (bspw. wegen zu hoher Restwelligkeit - Ripple & Noise).

In den Bezug auf Deine beiden Speicherabbilddateien passt dies alles perfekt ins Bild, wie ich es bereits zu den Power-State-Failure angeführt habe!
 
@KnSN, ich wollte nicht deine Empfehlung, Prime95 zu benutzen, in Frage stellen. Und es hat sich ja nun gezeigt, dass des System ein Problem mit Prime95 hat. Allerdings habe ich damit nicht all zu viel Erfahrung und halte mich lieber raus.

Nachtrag nur zur Info für KnSN: wenn ich debugge, lasse ich mir auch immer die Infos über die CPU anzeigen. Hier in diesem Fall liegt keine Übertaktung vor.
CPUID: "Intel(R) Core(TM) i5-4460 CPU @ 3.20GHz"
MaxSpeed: 3200
CurrentSpeed: 3200
 
Keine Ursache, Ari45! ^^
Ich dachte nur, dass Du einen konkreten Plan hast.
Als Experte No.1 wirst Du hier jederzeit gebraucht!

Hab diese und weitere Werte per CPU-Z und HWMonitor angefordert, um auch eventuelle Unter- oder Übertritte zu erkennen (Vdrop, Vdroop usw.).



ps: Erst jetzt so im Nachhinein fällt mir auf, dass in diesem Zusammenhang die Definition von X64_0x124_GenuineIntel_PROCESSOR_CACHE gleichzusetzen ist zu X64_0x124_GenuineIntel_PROCESSOR_CACHE_PRV, oder auch X64_0x124_GenuineIntel_PROCESSOR_BUS_PRV, was gezielt auf die Stromversorgung zum Prozessor deutet.
 
Zuletzt bearbeitet:
Ich verstehe zwar nur Bahnhof was du alles damit meinst KnSN aber ich kann nur so viel sagen das Mein System jetzt über 2Jahre alt ist und die Grafikkarte ca 4 Monate hatte vorher diese Probleme auch schon mit meiner alten Grafikkarte. Die Fehler tauchen immer wieder mal auf also nicht immer Dauerhaft und übertaktet hab ich nichts da ich nicht weis wie sowas geht.
 
MC-PRV ist keine Eigenschaft der Grafikkarte sondern des Prozessors in seiner Stromversorgung und -Verwaltung.
Natürlich trifft PRV auch auf die Grafikkarte oder anderen Komponenten zu, doch wir beschränken uns auf den Hauptprozessor.


Übertritte und Untertritte von Spannungen, Taktsignalen und Temperaturen sind völliger Alltag für die Komponenten infolge von zunehmender Elektromigration und Phasentransformation.
Die Prozesse daraus steigen desto exponentieller an je mehr die Komponenten gealtert sind und desto stärker und häufiger sie indes ihrer Betriebszeit strapaziert worden sind.

Beispiel: Ein Prozessor wird nach bereits einem Jahr seiner alltäglichen Betriebszeit unter häufig hohem Load (Videospielen, Videobearbeitung usw.) kaum mehr die niedrigen Temperaturwerte annehmen wie noch während der Anfangszeit, als er erstmals in Betrieb genommen wurde, egal wie oftmals die Wärmeleitpaste gegen welche auch immer ersetzt worden ist, denn das hat einen ganz geradlinigen Grund - und zwar in der Fortsetzung zu den Textblock von davor ...

Dies führt dazu, dass die Spezifikationen wegen veränderten Zuständen immer größere Abweichungen zur Norm gehen (Der Stoff nimmt in seiner veränderten Aggregation eine andere Eigenschaft an; der Zustand verlässt seine Ordnung - Entropie.) und das bewirkt das Gefälle (die Steilkurve) am Wirkungsgrad, also die zunehmende Steilheit an der thermischen Verlustleistung, welche in gasförmigen Aggregatzustand als sogenannte Abwärme austritt, was die Verringerung in der Wirkleistung (Effektivleistung) bedeutet, so wie es auch im Falle der Restwelligkeit eines Netzteils zu beobachten ist sobald es gen hohen Load herangeführt wird, oder sobald es in den Bereich der *Schutzleistung eintritt (Die Reserveleistung für den Ernstfall.), was dann zur Unterversorgung der Komponenten führt.

* Die Spitzenleistung des Netzteils ist höher als die nominell angegebene Leistung: Je höher der Wirkungsgrad des Netzteils ausfällt, desto weniger Puffer bedarf es für die Schutzleistung.


Die üblichen Verursacher für PRV sind nebst den Prozessor selbst auch das Mainboard, der Arbeitsspeicher und zumeist das Netzteil in der Wechselbeziehung zueinander (Korrelation).
 
Zuletzt bearbeitet:
Anzeige
Oben