nicht reproduzierbare Abstürze/Reboot

Hallo OpenSuse Forum,

seit geraumer Zeit plagen mich sporadische Abstürze oder ein direktes Neustarten des Systems. Ich weiß nicht genau, ob es ein Software- oder Hardwareproblem ist, vielleicht kann mir hier jemand weiterhelfen.
Die Probleme treten nur bei geringer Last auf (Youtube, Dokumentenbearbeitung mit Libreoffice, etc.), in Spielen ist es noch nie passiert. Der Absturz/Neustart kann nach 30 Minuten oder sogar mehrer Tage gar nicht auftreten.

Betriebssystem: openSUSE Tumbleweed 20221124
KDE-Plasma-Version: 5.26.3
KDE-Frameworks-Version: 5.100.0
Qt-Version: 5.15.7
Kernel-Version: 6.0.8-1-default (64-bit)
Grafik-Plattform: X11
Prozessoren: 16 × AMD Ryzen 7 1700 Eight-Core Processor
Speicher: 15,5 GiB Arbeitsspeicher
Grafikprozessor: AMD Radeon RX 480 Graphics

Ich weiß nicht ganz genau, wo ich für die Fehleranalyse beginnen soll. CPU und GPU Temperaturen sind in Ordnung, mein Mainboard berichtet mir von 127 Grad Celsius, das muss aber ein defekter Sensor sein.
Memtest86 ist mehrere Stunden ohne Fehler durchgelaufen.

Ich habe mal die Logs durchgeschaut (allerdings sehr laienhaft, ich weiß nicht genau wonach ich schauen muss) und einen Hardware Fehler in dmesg gefunden:

    0.388151] mce: [Hardware Error]: Machine check events logged 
    0.388152] mce: [Hardware Error]: CPU 5: Machine Check: 0 Bank 5: bea0000000000108 
    0.388173] mce: [Hardware Error]: TSC 0 ADDR 1ffffa533ea82 MISC d012000100000000 SYND 4d000000 IPID 500b000000000  
    0.388193] mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1669389767 SOCKET 0 APIC a microcode 8001138

Den Fehler findet man auch noch einmal in weiteren Quellen: https://bugzilla.kernel.org/show_bug.cgi?id=206903

Da der Beitrag inzwischen aber mehr als 2 Jahre alt ist und ich auch nicht genau das gleiche System habe, habt ihr evtl. noch eine Idee wie ich weiter vorgehen kann ohne aufs Geratewohl Hardware auszutauschen?

Danke!

Wenn ein System stürzt ab, normalerweise wird ein Core Dump produziert.
Bitte, mit der Benutzer „root” „coredumpctl” ausführen und, das Ergebnis hier veröffentlichen.

  • In umstanden, der folgende Kommando kann vielleicht was finden:
 # journalctl --no-hostname | grep 'SIGSEG'

Sind die folgenden Paketen installiert?

  • ucode-amd
  • kernel-firmware-amdgpu
  • libdrm_amdgpu1
  • xf86-video-amdgpu