System friert ein bei Last auf I/O System / syslog: Kernel BUG

Hallo zusammen,

ich habe ein Problem mit meinem 11.4 System.

Wenn ich größere Mengen von Daten (mehr als 10GB) kopiere oder verschiebe, kommt es unregelmäßig zu freezes. Heute hatte ich das Glück, dass vor so einem Freeze eine syslog-Meldung kam:

Apr 25 11:37:46 Nathan kernel:   945.541993] ------------ cut here ]------------
Apr 25 11:37:46 Nathan kernel:   945.541998] kernel BUG at /usr/src/packages/BUILD/kernel-desktop-2.6.37.1/linux-2.6.37/fs/buffer.c:3235!
Apr 25 11:37:46 Nathan kernel:   945.542001] invalid opcode: 0000 #1] PREEMPT SMP
Apr 25 11:37:46 Nathan kernel:   945.542004] last sysfs file: /sys/devices/system/cpu/cpu7/cache/index2/shared_cpu_map
Apr 25 11:37:46 Nathan kernel:   945.542006] CPU 2
Apr 25 11:37:46 Nathan kernel:   945.542007] Modules linked in: ip6t_LOG xt_tcpudp xt_pkttype ipt_LOG xt_limit af_packet edd ip6t_REJECT nf_conntrack_ipv6 nf_defra
g_ipv6 ip6table_raw xt_NOTRACK ipt_REJECT iptable_raw iptable_filter ip6table_mangle nf_conntrack_netbios_ns nf_conntrack_ipv4 nf_defrag_ipv4 ip_tables xt_conntrack
nf_conntrack ip6table_filter ip6_tables x_tables cpufreq_conservative cpufreq_userspace cpufreq_powersave snd_pcm_oss snd_mixer_oss snd_seq_midi acpi_cpufreq snd_s
eq_midi_event mperf microcode snd_seq fuse dm_mod nvidia(P) snd_usb_audio snd_pcm snd_timer snd_page_alloc snd_hwdep snd_usbmidi_lib snd_rawmidi snd_seq_device snd
soundcore firewire_ohci joydev firewire_core sr_mod r8169 cdrom iTCO_wdt i2c_i801 pcspkr iTCO_vendor_support serio_raw shpchp crc_itu_t xhci_hcd pci_hotplug wmi sg
button ext4 jbd2 crc16 fan processor thermal thermal_sys [last unloaded: preloadtrace]
Apr 25 11:37:46 Nathan kernel:   945.542048]
Apr 25 11:37:46 Nathan kernel:   945.542049] Pid: 53, comm: kswapd0 Tainted: P            2.6.37.1-1.2-desktop #1 To Be Filled By O.E.M. To Be Filled By O.E.M./P67
Extreme4
Apr 25 11:37:46 Nathan kernel:   945.542054] RIP: 0010:<ffffffff8117cd61>]  <ffffffff8117cd61>] free_buffer_head+0x61/0x70
Apr 25 11:37:46 Nathan kernel:   945.542060] RSP: 0018:ffff88041c4bbb10  EFLAGS: 00010287
Apr 25 11:37:46 Nathan kernel:   945.542061] RAX: ffff8801d7970ee0 RBX: ffff8801d7970e98 RCX: ffff88041baf2000
Apr 25 11:37:46 Nathan kernel:   945.542063] RDX: 0000000000000000 RSI: 0000000000001000 RDI: ffff8801d7970e98
Apr 25 11:37:46 Nathan kernel:   945.542065] RBP: ffff88043ef69af8 R08: 0000000000000000 R09: 0000000000000020
Apr 25 11:37:46 Nathan kernel:   945.542067] R10: 0000000000000000 R11: 0000000000000001 R12: 0000000000000001
Apr 25 11:37:46 Nathan kernel:   945.542069] R13: ffff88041c4bbc50 R14: 0000000000000001 R15: ffff88041c4bbbb0
Apr 25 11:37:46 Nathan kernel:   945.542072] FS:  0000000000000000(0000) GS:ffff8800bf280000(0000) knlGS:0000000000000000
Apr 25 11:37:46 Nathan kernel:   945.542074] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Apr 25 11:37:46 Nathan kernel:   945.542076] CR2: 00007f9e0b2ac000 CR3: 0000000001a03000 CR4: 00000000000406e0
Apr 25 11:37:46 Nathan kernel:   945.542078] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Apr 25 11:37:46 Nathan kernel:   945.542080] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Apr 25 11:37:46 Nathan kernel:   945.542082] Process kswapd0 (pid: 53, threadinfo ffff88041c4ba000, task ffff88041c4b8680)
Apr 25 11:37:46 Nathan kernel:   945.542084] Stack:
Apr 25 11:37:46 Nathan kernel:   945.542085]  ffff88043ef69af8 ffff8801d7970e98 ffff88043ef69af8 ffffffff8117cfac
Apr 25 11:37:46 Nathan kernel:   945.542089]  ffff88043f7ed2a8 ffff8801d7970e98 ffffea00066b5e20 ffffea00066b5df8
Apr 25 11:37:46 Nathan kernel:   945.542092]  ffff88041c4bbda0 ffffffff8110b867 ffff88041c4bbc50 ffff88043ef69a88
Apr 25 11:37:46 Nathan kernel:   945.542095] Call Trace:
Apr 25 11:37:46 Nathan kernel:   945.542102]  <ffffffff8117cfac>] try_to_free_buffers+0x7c/0xc0
Apr 25 11:37:46 Nathan kernel:   945.542106]  <ffffffff8110b867>] shrink_page_list+0x4f7/0x580
Apr 25 11:37:46 Nathan kernel:   945.542110]  <ffffffff8110bc7a>] shrink_inactive_list+0x10a/0x440
Apr 25 11:37:46 Nathan kernel:   945.542114]  <ffffffff8110c482>] shrink_zone+0x162/0x1e0
Apr 25 11:37:46 Nathan kernel:   945.542117]  <ffffffff8110d4d1>] balance_pgdat+0x411/0x4d0
Apr 25 11:37:46 Nathan kernel:   945.542121]  <ffffffff8110d702>] kswapd+0x172/0x350
Apr 25 11:37:46 Nathan kernel:   945.542124]  <ffffffff81079956>] kthread+0x96/0xa0
Apr 25 11:37:46 Nathan kernel:   945.542128]  <ffffffff81003d74>] kernel_thread_helper+0x4/0x10
Apr 25 11:37:46 Nathan kernel:   945.542131] Code: a0 f9 00 00 65 48 03 04 25 48 c5 00 00 83 28 01 e8 25 ff ff ff 83 6b 1c 01 48 8b 85 38 e0 ff ff a8 08 75 09 48 8
3 c4 08 5b 5d c3 <0f> 0b 48 83 c4 08 5b 5d e9 22 4e 3a 00 66 90 48 83 ec 18 89 fe
Apr 25 11:37:46 Nathan kernel:   945.542157] RIP  <ffffffff8117cd61>] free_buffer_head+0x61/0x70
Apr 25 11:37:46 Nathan kernel:   945.542159]  RSP <ffff88041c4bbb10>
Apr 25 11:37:46 Nathan kernel:   945.542194] --- end trace 4c7f2913445d3932 ]---
Apr 25 11:38:55 Nathan kernel:  1013.975472] BUG: unable to handle kernel NULL pointer dereference at           (null)
Apr 25 11:38:55 Nathan kernel:  1013.975480] IP: <          (null)>]           (null)
Apr 25 11:38:55 Nathan kernel:  1013.975484] PGD 41d64a067 PUD 41dd6b067 PMD 0
Apr 25 11:38:55 Nathan kernel:  1013.975487] Oops: 0000 #2] PREEMPT SMP
Apr 25 11:38:55 Nathan kernel:  1013.975490] last sysfs file: /sys/devices/system/cpu/cpu7/cache/index2/shared_cpu_map
Apr 25 11:38:55 Nathan kernel:  1013.975494] CPU 1
Apr 25 11:38:55 Nathan kernel:  1013.975495] Modules linked in: ip6t_LOG xt_tcpudp xt_pkttype ipt_LOG xt_limit af_packet edd ip6t_REJECT nf_conntrack_ipv6 nf_defrag_ipv6 ip6table_raw xt_NOTRACK ipt_REJECT iptable_raw iptable_filter ip6table_mangle nf_conntrack_netbios_ns nf_conntrack_ipv4 nf_defrag_ipv4 ip_tables xt_conntrack nf_conntrack ip6table_filter ip6_tables x_tables cpufreq_conservative cpufreq_userspace cpufreq_powersave snd_pcm_oss snd_mixer_oss snd_seq_midi acpi_cpufreq snd_seq_midi_event mperf microcode snd_seq fuse dm_mod nvidia(P) snd_usb_audio snd_pcm snd_timer snd_page_alloc snd_hwdep snd_usbmidi_lib snd_rawmidi snd_seq_device snd soundcore firewire_ohci joydev firewire_core sr_mod r8169 cdrom iTCO_wdt i2c_i801 pcspkr iTCO_vendor_support serio_raw shpchp crc_itu_t xhci_hcd pci_hotplug wmi sg button ext4 jbd2 crc16 fan processor thermal thermal_sys [last unloaded: preloadtrace]
Apr 25 11:38:55 Nathan kernel:  1013.975539]
Apr 25 11:38:55 Nathan kernel:  1013.975542] Pid: 1287, comm: Xorg Tainted: P      D     2.6.37.1-1.2-desktop #1 To Be Filled By O.E.M. To Be Filled By O.E.M./P67 Extreme4
Apr 25 11:38:55 Nathan kernel:  1013.975547] RIP: 0010:<0000000000000000>]  <          (null)>]           (null)
Apr 25 11:38:55 Nathan kernel:  1013.975550] RSP: 0018:ffff88041a0b9f20  EFLAGS: 00010292
Apr 25 11:38:55 Nathan kernel:  1013.975553] RAX: 0000000000400000 RBX: 0000000000000000 RCX: 0000000000000000
Apr 25 11:38:55 Nathan kernel:  1013.975556] RDX: 0000000000000003 RSI: 0000000000000002 RDI: ffff88041ac59400
Apr 25 11:38:55 Nathan kernel:  1013.975558] RBP: ffff88041ac59400 R08: 0000000000000001 R09: 0000000000000005
Apr 25 11:38:55 Nathan kernel:  1013.975561] R10: 0000000000000000 R11: 0000000000003202 R12: 0000000000000003
Apr 25 11:38:55 Nathan kernel:  1013.975564] R13: ffff88041ac596d0 R14: 00000000007d1ae0 R15: 00000000007ecc00
Apr 25 11:38:55 Nathan kernel:  1013.975567] FS:  00007fcc25f57700(0000) GS:ffff8800bf240000(0000) knlGS:0000000000000000
Apr 25 11:38:55 Nathan kernel:  1013.975570] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Apr 25 11:38:55 Nathan kernel:  1013.975572] CR2: 0000000000000000 CR3: 000000041d4c8000 CR4: 00000000000406e0
Apr 25 11:38:55 Nathan kernel:  1013.975575] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Apr 25 11:38:55 Nathan kernel:  1013.975578] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Apr 25 11:38:55 Nathan kernel:  1013.975581] Process Xorg (pid: 1287, threadinfo ffff88041a0b8000, task ffff88041b82c880)
Apr 25 11:38:55 Nathan kernel:  1013.975583] Stack:
Apr 25 11:38:55 Nathan kernel:  1013.975585]  ffffffff814ad611 ffff88041a0b9f64 0000000000000002 ffff880416970840
Apr 25 11:38:55 Nathan kernel:  1013.975590]  0000000000000031 0000000000dec200 ffffffff8141337c 0000000000000000
Apr 25 11:38:55 Nathan kernel:  1013.975593]  0000000000000000 0000000000e35300 0000000000f3f530 0000000000f3fe00
Apr 25 11:38:55 Nathan kernel:  1013.975597] Call Trace:
Apr 25 11:38:55 Nathan kernel:  1013.975600] Inexact backtrace:
Apr 25 11:38:55 Nathan kernel:  1013.975600]
Apr 25 11:38:55 Nathan kernel:  1013.975607]  <ffffffff814ad611>] ? unix_shutdown+0x161/0x1d0
Apr 25 11:38:55 Nathan kernel:  1013.975611]  <ffffffff8141337c>] ? sys_shutdown+0x5c/0x70
Apr 25 11:38:55 Nathan kernel:  1013.975616]  <ffffffff81002f8b>] ? system_call_fastpath+0x16/0x1b
Apr 25 11:38:55 Nathan kernel:  1013.975618] Code:  Bad RIP value.
Apr 25 11:38:55 Nathan kernel:  1013.975621] RIP  <          (null)>]           (null)
Apr 25 11:38:55 Nathan kernel:  1013.975624]  RSP <ffff88041a0b9f20>
Apr 25 11:38:55 Nathan kernel:  1013.975626] CR2: 0000000000000000
Apr 25 11:38:55 Nathan kernel:  1013.975629] --- end trace 4c7f2913445d3933 ]---
Apr 25 11:38:55 Nathan kernel:  1014.027671] NVRM: Xid (0001:00): 13, 0003 00000000 0000502d 00000290 00000000 00000140

Nach der Meldung gab es dieses mal auch keinen direkten Freeze, sondern meine aktuelle KDE-Session wurde beendet und ich konnte mich ohne Neustart wieder anmelden. Das hielt aber nur für wenige Minuten, dann stand das System komplett still, so wie sonst ohne Vorwarnung.

Meine verwendete Hardware:

Mainboard: Asrock P67 Extreme 4
CPU: Intel i7 2600K
Ram: 4 x 4GB PC1333 Geil Value Plus
System-HDD: Crucial RealSSD 300C 128GB
Daten HHD’s: 2 x Hitachi 3TB

Wenn ich normal an dem Rechner arbeite (surfen, mails, etc.) ist alles stabil. Die Freezes treten nur auf, wenn ich Daten kopiere. Dabei ist es egal, ob ich zwischen den S-ATA Festplatten hin und her kopiere oder ob die Daten von einer externen USB Festplatte kommen.

Ich habe leider absolut keine Erfahrungen mit Bugzilla und weiß auch nicht, ob das hier ein wirklicher Bug ist, oder ob der Fehler nicht doch woanders liegt.

Ja, es sieht wie ein Bug aus. Leider habe ich keine Dateien, die große als 10 Gb sind, und kann nicht das reproduzieren.

Ah, da habe ich mich wohl schlecht ausgerückt. Nicht eine einzelne Datei ist größer als 10GB, sondern ein Ordner mit mehreren Datein in diesem.

Konkret wollte ich meinen alten Datenbestand auf eine neue Festplatte kopieren und habe mit meinen Fotos angefangen. Es waren also mehrere zehntausend Dateien mit einer Größe von jeweils mehreren Megabyte.

Leckere Hardware hast Du da…

Ist der Kernel selbstgebaut oder ein openSUSE Stock Kernel ?

Den Kernel habe ich selbst nicht angefasst, er ist also original aus dem Repository.

Ein “uname -a” gibt mir folgendes aus: Linux Nathan 2.6.37.1-1.2-desktop #1 SMP PREEMPT 2011-02-21 10:34:10 +0100 x86_64 x86_64 x86_64 GNU/Linux

Bis auf die Updates aus dem Repository habe ich auf dem System nichts anderes installiert oder selber kompiliert.

Ich habe mal versucht bei Google was zu finden, aber exakt diesen Fehler habe ich nicht gefunden :frowning:
Vielleicht jemand anders ?

Ein Versuch wäre noch, auf den 2.6.38 Kernel umzusteigen - vielleicht ist das Problem da gelöst. Den gibt es z.B. hier:
Kernel Repository
Oder im Tumbleweed Repo, aber davon würde ich abraten, bis Du das Problem gelöst hast.

Ich habe interessehalber gerade auch mal Fotos kopiert und zwar von einer externen USB Platte
einen Ordner mit ca. 30 Unterordner in welchen 1392 Dateien mit einer Gesamtgröße von 16,5 GB waren auf eine der internen HD´s.
Der Kopiervorgang verlief problemlos und ich konnte während des Kopiervorgangs relativ zügig weiter arbeiten. Kernel 2.6.37-1-1 desktop, also der Original Suse Kernel.
Von daher bin ich etwas skeptisch ob es wirklich ein Kernel-Bug ist.

Dietger

Nur mal so paar neugierige Fragen aus der Amateur-Ecke:

Datensicherung vor weiterem Herumprobieren?
Von einem Live-System (openSUSE, Knoppix, …) aus oder/und in kleinen Schritten?
Funktioniert das Programm/Kommando rsync ?

Wohl besonders doofe Frage
“Nathan” hast Du Dein System/Deine Installation genannt - als das ist die Alternative zu der kryptischen Buchstabenfolge, die sonst dem System automatisch vergibt:
Also statt “linux-o7fu.site” bei meinem System im Moment:

uname -a
Linux linux-o7fu.site 2.6.37.1-1.2-default #1 SMP 2011-02-21 10:34:10 +0100 i686 i686 i386 GNU/Linux

Nur Standard?
Der Kernel ist aus dem 11.4 OSS bzw. Update Repositoy, wenn ich alles richtig verstanden habe - nicht irgendein neuer, ziemlich experimenteller Kernel aus dem Kernel Repositoy oder gar ein allerneuster experimenteller Kernel of the Day, richtig?

Andere Kernel Flavors?
Hast Du mal versucht, ob die gleiche Fehlfunktion auch mit anderen Kernel flavors auftritt - debug, default, vanilla, … (pae dürfte es wohl für 64bit nicht geben, oder?) ?

Einfrieren bei anderen Benutzern?
Im Übrigen habe ich mal forums.openSUSE.org nach Einfrieren/Freeze/Freezing in der letzten Zeit durchsucht und bei den meisten ein Stichwort/Tag “freeze” angebracht. Du kannst ja mal unten klicken … - oder selbst mit
freeze site:opensuse.org - Google Search
nach Treffern auf forums.openSUSE.org für den letzten Monat suchen.

Hardware?
Tritt der Fehler auch beim Kopieren auf eine andere Festplatte oder/und von einer anderen Festplatte auf?

Bug-Report
Und insbesondere wenn selbst Alexander Naumov von SUSE/Novell schreibt, dass es für ihn wie ein Software-Fehler/Bug aussehe, es wird Dir wohl auch keiner böse sein, wenn Du einen Bug-Report machen würdest:

Soweit ich kann und soll, werde ich auch gerne bei der Formulierung auf Englisch helfen (so wie ich dieses Forum einschätze, andere - gegebenenfalls kompetentere - Mitglieder auch…).

Vergleiche auch:
Thread: Wo und wie Bug Report einstellen?

Viel Erfolg (insbesondere bei der Datensicherung vor dem Herumprobieren)
Martin
(pistazienfresser)

Hihi… Ich wüsste gerne, warum Du das fragst. Hast Du einen Hintergedanken ? :slight_smile:

Das Wort Nathan assoziiere ich mit dem Drama “Nathan der Weise” von Lessing - daher wäre es für mich ein passender Name für einen (vielleicht besonders toleranten, für viele [virtualisierte] Betriebssysteme ausgelegten oder weisen) speziellen Kernel für ein Betriebssystem für einen Supercomputer oder Ähnliches.

Wohl daher hatte ich Blödnase ca. 10 (gefühlte 30) Minuten lang in den Software-Verzeichnissen, auf den Mailinglisten und im ganzen Netz gesucht, ob es irgendwo einen speziellen Kernel (flavor) “Linux Nathan” oder etwas Ähnliches gebe - bis mir dann der Gedanke kam, dass es nicht der Name eines Kernels/einer Kernel-Variante, sondern der des individuellen Systems/der Installation von Nimark sein dürfte. Auch auf die Gefahr hin, allgemeinen Frohsinn auszulösen, wollte ich dennoch die von mir zuerst erwogene Möglichkeit ausschließen.

Zudem schwebte bei mir im Hinterkopf wohl auch noch der Gedanke, dass ich durch das Veröffentlichen meiner allerdümsten Gedanken vielleicht auch die Erwartungen an meine Fachkunde in Bezug auf Informatik/Linux basierte Systeme gering halten könnte.

Ist die Erklärung einigermaßen plausibel?
Alle Klarheiten beseitigt?
Erheiterung weiter gesteigert?

purzelnd pistazienfresser
(Martin)

Oh, jetzt gibt es doch schon etwas mehr Resonanz. Erst mal vielen Dank an alle fleißigen Helfer!

Um der Reihe nach auf die Fragen einzugehen:

  1. Eine Datensicherung existiert; ich halte meine wichtigen Daten immer auch auf USB Platten vor.

  2. Der Name “Nathan” kommt von mir, hat aber eigentlich nichts mit “Nathan der Weise” zu tun, sondern wurde von mir aus einem der ersten Perry Rhoadan Romane entwendet. Dort wird ein leistungsfähiger Rechner so genannt, mehr Hintergedanken gab es dabei nicht, es ist auch kein besondere Version des Kernels damit gemeint.

  3. Der Kernel ist aus dem normalen oder dem Update-Repository, nichts experimentelles, nein. Das System wird hauptsächlich zum arbeiten genutzt, da sollte es eigentlich stabil laufen. Meine “Spielkiste” für diese Frickeleien ist eine andere.

  4. Ich habe, bevor ich das ganze hier geschrieben habe, auch schon nach ähnlichen Berichten im Netz gesucht, konnte aber genau diese Konstellation nicht noch ein mal finden. Trotzdem danke für die Hilfe.

  5. Die Quell- und Zielmedien spielen scheinbar keine Rolle. Ich habe testweise die neuen 3TB Platten abgeklemmt und von einer alten 1TB Platte auf eine andere kopiert. Von beiden Festplatten weiß ich, dass sie noch vor einer Woche fehlerlos liefen. Auch habe ich testweise von einer externen USB Festplatte auf eine andere USB Festplatte und auch auf eine der intern verbauten Festplatten kopiert. Als letzte Möglichkeit habe ich dann eine der 1TB Platten an einen anderen Rechner angeschlossen, dort einen Samba-Share eingerichtet und über das Netzwerk kopiert.

Aber alle Konstellationen liefen auf den gleichen Fehler, mal früher, mal später.

  1. Ja, ich werde mich da mal durchwühlen. Mein Englisch sollte ausreichend sein.

Um den Fehler noch detaillierter zu beschreiben:

Ich habe in dem Rechner mehrere Festplatten an den unterschiedlichsten Controllern (P67 3GB/s, P67 6GB/s, Marvell 6GB/s) ausprobiert, auch USB Medien an den USB 2.0 Ports und sogar einen Kopiervorgang über einen Samba-Share getestet. Der Fehler trat bei allen Varianten auf.
Mein Eigentliches Ansinnen war, meine ganzen Produktiovdaten auf eine neue 3TB Platte zu bewegen um die älteren, kleineren Platten aus dem System entfernen zu können. Das Gesamtdatenvolumen entspricht dabei etwa 1,5TB, dabei machen meine Fotos einen großen Teil aus, da ich leidenschaftlich gerne mit meiner Spiegelreflexkammera knipse und auch die RAW-Daten abspeichere.

Wie dem auch sei, wenn ich den Rechner frisch boote, dann kann es vorkommen, dass mal 100GB oder auch 200GB ohne Fehler kopiert werden. Wenn ich mehr auf einmal ausgewählt habe, also z.B. 500GB, dann gibt es über kurz oder lang einen Freeze.
Manchmal passiert das auch schon nach 10GB, ich kann den Fehler also nicht zu 100% nachstellen, da er unregelmäßig auftritt.

Ich habe noch einige neue Erfahrungen gesammelt, so dass ich momentan etwas davon ab bin, der Software den Fehler in die Schuhe zu schieben, denn: Ich habe auf diesem Rechner ein Dualboot-System mit einem Windows 7 eingerichtet, da ich für einige Programme zur Audiobearbeitung um ein MS System leider nicht herumkomme. Auch auf diesem System kommt es zu merkwürdigen Fehlern beim Bewegen von Daten. Hier startet das System in unterschiedlichen Abständen einfach neu.

Es sieht also mittlerweile so aus, als ob ein Teil meiner Hardware einen Fehler hat und der hier beschriebene Fehler nicht unbedingt etwas mit dem Bug aus den Logs zu tun haben muss.

Nachdem ich so weit war, habe ich meine Platten ein mal mit smartctl gecheckt, konnte aber nichts feststellen. Wahrscheinlich liegt der Fehler beim Mainbaord. Daher werde ich mich nun mit dem Asrock-Support in Verbindung setzen.

Ist die Erklärung einigermaßen plausibel?
Alle Klarheiten beseitigt?
Erheiterung weiter gesteigert?

Zu allen 3 Punkten JA lol!

Dietger

Der Name “Nathan” kommt von mir, hat aber eigentlich nichts mit “Nathan der Weise” zu tun, sondern wurde von mir aus einem der ersten Perry Rhoadan Romane entwendet. Dort wird ein leistungsfähiger Rechner so genannt,

Das war doch der auf dem Mond oder ?

Wahrscheinlich liegt der Fehler beim Mainbaord.

Ich würde da aber auch das Netzteil nicht ausschließen. Hatte auch mal so ein selbstständig neu startendes System - war letztendlich das Netzteil.
Hast Du auch schon einmal an ein thermisches Problem gedacht ?

Dietger

Mond oder Venus, ich weiß es nicht mehr. Dafür ist das schon etwas zu lange her.

Das Netzteil wäre meine letzte Option vor dem Tausch des Mainboards, ich habe aber leider kein geeignetes Ersatznetzteil zur Hand, da werde ich mich aber demnächst drum bemühen.

Ein thermisches Problem war eigentlich meine erste Vermutung, aber ich habe dann verschiedene Belastungstests durchgeführt und konnte nichts Außergewöhnliches feststellen. Die Temperaturen der CPU, Grafikkarte und des Chipsatz sind alle sehr gut gewesen nach meinen Messungen. Zudem habe ich keine Probleme bei unterschiedlichen Benchmarktests feststellen können, dabei kletterten die Temperaturen deutlich höher, als beim Kopiervorgang.

Alle Klarheiten beseitigt :wink:
Meine Frage war im Übrigen nicht ironisch gemeint. Mich hat einfach nur interessiert, ob das möglicherweise ein Teil der Strategie zur Problemfindung war. Manchmal erschließt sich Außenstehenden der Sinn von durchaus sinnvollen Fragen nicht gleich.

An einen speziellen Kernel-Flavour hätte ich jedenfalls nicht gedacht :slight_smile:
Aber eine gute Idee.

Bei 16 GB RAM sage ich das ja nur ungern, aber haste mal einen Speichertest laufen lassen ?
Könnte zumindest eine Ursache sein…

Ja, das habe ich. Memtest 86+ lief mehrere Stunden ohne Probleme. Danach habe ich noch die Einzeltests 5 und 8 jeweils mehrere Stunden laufen lassen, es wurden keine Fehler gefunden.

Am 2011-04-28 22:06, schrieb Nimark:
>
> herbwahn;2331683 Wrote:
>> Bei 16 GB RAM sage ich das ja nur ungern, aber haste mal einen
>> Speichertest laufen lassen ?
>> Könnte zumindest eine Ursache sein…
>
> Ja, das habe ich. Memtest 86+ lief mehrere Stunden ohne Probleme.
> Danach habe ich noch die Einzeltests 5 und 8 jeweils mehrere Stunden
> laufen lassen, es wurden keine Fehler gefunden.
>

boah ey, mehrere Stunden …!

Nein, im Ernst: Ich hatte hier mal einen Rechner mit sporadischen
Fehlern, bei dem memtest auch während der ersten Durchgänge keine
Fehler meldete. Erst nach zwei Tagen Dauer kamen die
(sporadischen) Fehler zutage.

Meine Methode, um weiche HW zu entlarven: Mache eine
Kernel-Compilation mit der -j Option (= maximale
Parallelisierung). Wenn die fehlerfrei durchläuft, darfst du
deiner HW den Stempel “fehlerfrei und stabil” geben. Wenn nicht,
weißt du, dass du ein HW-Problem hast - wo auch immer das im
Detail dann steckt. Bei neueren Boards hilft manchmal ein
BIOS-Update.

Christoph


email:
nurfuerspam → gmx
de → net