NVIDIA Probleme nach Update des Kernels oder Update Driver

Liebe Community,

ich habe ein Problem nach dem Update des Kernels bzw. der NVIDIA Treiber. Bisher wurde ich noch nicht fündig nach einer umfangreichen Suche in vielen Formen.
Ich habe ein sehr gut funktionierendes System mit den prop. NVIDIA Treibern. Nur nach Kernel/Treiberupdates startet die Grafik nicht mehr.
Ich kann mein System glücklicherweise mit clonezilla jederzeit wieder zurücksetzen (alternativ auch mit BTRFS Snapshots).

Details:

Funktionierendes System:
Opensuse tumbleweed rolling release
| Kernel 4.18.15.1-2
|
mit
NVIDIA Treiber:
390.87-10.3

nvidia-gfxG04-kmp-default - NVIDIA graphics driver kernel module for GeForce 400 series and newer

390.87_k4.18.15_1-10.2

Nouveau Treiber sind auf Blacklist:

Nouveau

blacklist nouveau
options nouveau modeset=0

GraKa:
chris@HAL9000:~> sudo lspci | fgrep -i nv
09:00.0 VGA compatible controller: NVIDIA Corporation GP107 [GeForce GTX 1050 Ti] (rev a1)
09:00.1 Audio device: NVIDIA Corporation GP107GL High Definition Audio Controller (rev a1)
chris@HAL9000:~>

Probleme treten auf, wenn ich folgendes versuche:
a) Update auf nvidia-gfxG04-kmp-default 390.87_k4.19.1_1-10.05 inkl. aller abhängigen Module
b) Update auf aktuellen kernel (derzeit 4.19.5-1.5)

In dem Fall bootet der Rechner zwar, aber ich komme “nur” in das Terminal Login ohne GUI.

Logfiles (“rote” Meldungen)

/var/log/warn:

2018-12-04T17:10:57.738956+01:00 HAL9000 kernel: 1.714210] [Firmware Bug]: ACPI MWAIT C-state 0x0 not supported by HW (0x0)
2018-12-04T17:10:57.739038+01:00 HAL9000 kernel: 2.916392] ata3.00: NCQ Send/Recv Log not supported
2018-12-04T17:10:57.739176+01:00 HAL9000 kernel: 5.380685] ata8.00: supports DRM functions and may not be fully accessible
2018-12-04T17:10:57.739432+01:00 HAL9000 kernel: 6.952809] systemd: 20 output lines suppressed due to ratelimiting
2018-12-04T17:10:57.739515+01:00 HAL9000 kernel: 7.264245] acpi PNP0C14:02: duplicate WMI GUID 05901221-D566-11D1-B2F0-00A0C9062910 (first instance was on PNP0C14:01)
2018-12-04T17:10:57.739520+01:00 HAL9000 kernel: 7.294725] sp5100-tco sp5100-tco: Watchdog hardware is disabled
2018-12-04T17:10:57.739591+01:00 HAL9000 kernel: 7.561442] FAT-fs (sdd1): Volume was not properly unmounted. Some data may be corrupt. Please run fsck.
2018-12-04T17:10:57.809342+01:00 HAL9000 kernel: 8.080274] vboxdrv: loading out-of-tree module taints kernel.
2018-12-04T17:10:57.983735+01:00 HAL9000 systemd[1]: nss-lookup.target: Dependency Before=nss-lookup.target dropped
2018-12-04T17:10:58.044625+01:00 HAL9000 kernel: 8.319046] VBoxNetFlt: Successfully started.
2018-12-04T17:10:58.053367+01:00 HAL9000 kernel: 8.325308] VBoxNetAdp: Successfully started.
2018-12-04T17:10:58.057388+01:00 HAL9000 kernel: 8.329391] VBoxPciLinuxInit
2018-12-04T17:10:58.239479+01:00 HAL9000 systemd[1]: nss-lookup.target: Dependency Before=nss-lookup.target dropped
2018-12-04T17:10:58.480292+01:00 HAL9000 systemd[1]: nss-lookup.target: Dependency Before=nss-lookup.target dropped
2018-12-04T17:10:58.771517+01:00 HAL9000 systemd[1]: nss-lookup.target: Dependency Before=nss-lookup.target dropped
2018-12-04T17:10:59.792055+01:00 HAL9000 wickedd[1189]: unable to translate eap protocol PWD
2018-12-04T17:11:29.040316+01:00 HAL9000 sddm[2913]: Failed to read display number from pipe
2018-12-04T17:11:29.040434+01:00 HAL9000 sddm[2913]: Display server failed to start. Exiting
2018-12-04T17:11:29.086086+01:00 HAL9000 systemd[1]: display-manager.service: Main process exited, code=dumped, status=6/ABRT
2018-12-04T17:11:29.086237+01:00 HAL9000 systemd[1]: display-manager.service: Failed with result ‘core-dump’.
2018-12-04T17:11:29.097730+01:00 HAL9000 systemd-coredump[2994]: Process 2913 (sddm) of user 0 dumped core.

XOrg.log
X.Org X Server 1.20.3
X Protocol Version 11, Revision 0
38.888] Build Operating System: openSUSE SUSE LINUX
38.888] Current Operating System: Linux HAL9000 4.18.15-1-default #1 SMP PREEMPT Thu Oct 18 08:56:17 UTC 2018 (5a53676) x86_64
38.888] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-4.18.15-1-default root=UUID=f765a562-0c90-420d-a364-b68ea86bc9f0 resume=/dev/disk/by-id/ata-Samsung_SSD_850_EVO_250GB_S2R6NX0JC38723L-part2 splash=silent quiet showopts acpi=ht noapic nohz=off zswap.enabled=1
38.888] Build Date: 29 October 2018 12:00:00PM
38.888]
38.888] Current version of pixman: 0.34.0
38.888] Before reporting problems, check http://wiki.x.org
to make sure that you have the latest version.
38.888] Markers: (–) probed, () from config file, (==) default setting,
(++) from command line, (!!) notice, (II) informational,
(WW) warning, (EE) error, (NI) not implemented, (??) unknown.
38.888] (==) Log file: “/var/log/Xorg.0.log”, Time: Tue Dec 4 17:11:28 2018
38.889] (==) Using config directory: “/etc/X11/xorg.conf.d”
38.889] (==) Using system config directory “/usr/share/X11/xorg.conf.d”
38.889] (==) No Layout section. Using the first Screen section.
38.890] (==) No screen section available. Using defaults.
38.890] (
) |–>Screen “Default Screen Section” (0)
38.890] (**) | |–>Monitor “<default monitor>”
38.890] (==) No monitor specified for screen “Default Screen Section”.
Using a default monitor configuration.
38.890] (==) Automatically adding devices
38.890] (==) Automatically enabling devices
38.890] (==) Automatically adding GPU devices
38.890] (==) Max clients allowed: 256, resource mask: 0x1fffff
38.893] (WW) The directory “/usr/share/fonts/misc/sgi” does not exist.
38.893] Entry deleted from font path.
38.893] (==) FontPath set to:
/usr/share/fonts/misc:unscaled,
/usr/share/fonts/Type1/,
/usr/share/fonts/100dpi:unscaled,
/usr/share/fonts/75dpi:unscaled,
/usr/share/fonts/ghostscript/,
/usr/share/fonts/cyrillic:unscaled,
/usr/share/fonts/truetype/,
built-ins
38.893] (==) ModulePath set to “/usr/lib64/xorg/modules”
38.893] (WW) Ignoring unrecognized extension “XFree86-DGA”
38.893] (II) The server relies on udev to provide the list of input devices.
If no devices become available, reconfigure udev or disable AutoAddDevices.
38.893] (II) Loader magic: 0x5649f0017d00
38.893] (II) Module ABI versions:
38.893] X.Org ANSI C Emulation: 0.4
38.893] X.Org Video Driver: 24.0
38.893] X.Org XInput driver : 24.1
38.893] X.Org Server Extension : 10.0
38.894] (++) using VT number 7

38.894] (II) systemd-logind: logind integration requires -keeptty and -keeptty was not provided, disabling logind integration
38.898] (--) PCI:*(9@0:0:0) 10de:1c82:1043:8627 rev 161, Mem @ 0xf6000000/16777216, 0xe0000000/268435456, 0xf0000000/33554432, I/O @ 0x0000d000/128, BIOS @ 0x????????/131072
38.898] (II) LoadModule: "glx"
38.900] (II) Loading /usr/lib64/xorg/modules/extensions/libglx.so
39.001] (II) Module glx: vendor="NVIDIA Corporation"
39.001]     compiled for 4.0.2, module version = 1.0.0
39.001]     Module class: X.Org Server Extension
39.001] (II) NVIDIA GLX Module  390.87  Tue Aug 21 16:10:56 PDT 2018
39.007] (II) Scanning /etc/X11/xorg_pci_ids directory for additional PCI ID's supported by the drivers
39.007] (==) Matched nvidia as autoconfigured driver 0
39.007] (==) Matched nouveau as autoconfigured driver 1
39.007] (==) Matched nv as autoconfigured driver 2
39.007] (==) Matched modesetting as autoconfigured driver 3
39.007] (==) Matched fbdev as autoconfigured driver 4
39.007] (==) Matched vesa as autoconfigured driver 5
39.007] (==) Assigned the driver to the xf86ConfigLayout
39.007] (II) LoadModule: "nvidia"
39.007] (II) Loading /usr/lib64/xorg/modules/drivers/nvidia_drv.so
39.027] (II) Module nvidia: vendor="NVIDIA Corporation"
39.027]     compiled for 4.0.2, module version = 1.0.0
39.027]     Module class: X.Org Video Driver
39.027] (II) LoadModule: "nouveau"
39.027] (II) Loading /usr/lib64/xorg/modules/drivers/nouveau_drv.so
39.038] (II) Module nouveau: vendor="X.Org Foundation"
39.038]     compiled for 1.20.2, module version = 1.0.15
39.038]     Module class: X.Org Video Driver
39.038]     ABI class: X.Org Video Driver, version 24.0
39.038] (II) LoadModule: "nv"
39.038] (II) Loading /usr/lib64/xorg/modules/drivers/nv_drv.so
39.039] (II) Module nv: vendor="X.Org Foundation"
39.039]     compiled for 1.20.0, module version = 2.1.21
39.039]     Module class: X.Org Video Driver
39.039]     ABI class: X.Org Video Driver, version 24.0
39.039] (II) LoadModule: "modesetting"
39.039] (II) Loading /usr/lib64/xorg/modules/drivers/modesetting_drv.so
39.040] (II) Module modesetting: vendor="X.Org Foundation"
39.040]     compiled for 1.20.3, module version = 1.20.3
39.040]     Module class: X.Org Video Driver
39.040]     ABI class: X.Org Video Driver, version 24.0
39.040] (II) LoadModule: "fbdev"
39.040] (II) Loading /usr/lib64/xorg/modules/drivers/fbdev_drv.so
39.040] (II) Module fbdev: vendor="X.Org Foundation"
39.041]     compiled for 1.20.0, module version = 0.5.0
39.041]     Module class: X.Org Video Driver
39.041]     ABI class: X.Org Video Driver, version 24.0
39.041] (II) LoadModule: "vesa"
39.041] (II) Loading /usr/lib64/xorg/modules/drivers/vesa_drv.so
39.041] (II) Module vesa: vendor="X.Org Foundation"
39.041]     compiled for 1.20.0, module version = 2.4.0
39.041]     Module class: X.Org Video Driver
39.041]     ABI class: X.Org Video Driver, version 24.0
39.041] (II) NVIDIA dlloader X Driver  390.87  Tue Aug 21 15:44:49 PDT 2018
39.041] (II) NVIDIA Unified Driver for all Supported NVIDIA GPUs
39.041] (II) NOUVEAU driver 
39.041] (II) NOUVEAU driver for NVIDIA chipset families :
39.041]     RIVA TNT        (NV04)
39.041]     RIVA TNT2       (NV05)
39.041]     GeForce 256     (NV10)
39.041]     GeForce 2       (NV11, NV15)
39.041]     GeForce 4MX     (NV17, NV18)
39.041]     GeForce 3       (NV20)
39.041]     GeForce 4Ti     (NV25, NV28)
39.041]     GeForce FX      (NV3x)
39.041]     GeForce 6       (NV4x)
39.041]     GeForce 7       (G7x)
39.041]     GeForce 8       (G8x)
39.041]     GeForce GTX 200 (NVA0)
39.041]     GeForce GTX 400 (NVC0)
39.041] (II) NOUVEAU driver 
39.041] (II) NOUVEAU driver for NVIDIA chipset families :
39.041]     RIVA TNT        (NV04)
39.042]     RIVA TNT2       (NV05)
39.042]     GeForce 256     (NV10)
39.042]     GeForce 2       (NV11, NV15)
39.042]     GeForce 4MX     (NV17, NV18)
39.042]     GeForce 3       (NV20)
39.042]     GeForce 4Ti     (NV25, NV28)
39.042]     GeForce FX      (NV3x)
39.042]     GeForce 6       (NV4x)
39.042]     GeForce 7       (G7x)
39.042]     GeForce 8       (G8x)
39.042]     GeForce GTX 200 (NVA0)
39.042]     GeForce GTX 400 (NVC0)
39.042] (II) modesetting: Driver for Modesetting Kernel Drivers: kms
39.042] (II) FBDEV: driver for framebuffer: fbdev
39.042] (II) VESA: driver for VESA chipsets: vesa
39.044] (II) Loading sub module "fb"
39.044] (II) LoadModule: "fb"
39.045] (II) Loading /usr/lib64/xorg/modules/libfb.so
39.045] (II) Module fb: vendor="X.Org Foundation"
39.045]     compiled for 1.20.3, module version = 1.0.0
39.046]     ABI class: X.Org ANSI C Emulation, version 0.4
39.046] (II) Loading sub module "wfb"
39.046] (II) LoadModule: "wfb"
39.046] (II) Loading /usr/lib64/xorg/modules/libwfb.so
39.050] (II) Module wfb: vendor="X.Org Foundation"
39.050]     compiled for 1.20.3, module version = 1.0.0
39.050]     ABI class: X.Org ANSI C Emulation, version 0.4
39.050] (II) Loading sub module "ramdac"
39.050] (II) LoadModule: "ramdac"
39.050] (II) Module "ramdac" already built-in
39.057] (EE) NVIDIA: Failed to initialize the NVIDIA kernel module. Please see the                      &lt;&lt;&lt;&lt;&lt;&lt;
39.058] (EE) NVIDIA:     system's kernel log for additional error messages and                             &lt;&lt;&lt;&lt;&lt;&lt;
39.058] (EE) NVIDIA:     consult the NVIDIA README for details.
39.182] (EE) [drm] Failed to open DRM device for pci:0000:09:00.0: -19
39.307] (EE) [drm] Failed to open DRM device for pci:0000:09:00.0: -19
39.307] (EE) open /dev/dri/card0: No such file or directory
39.307] (WW) Falling back to old probe method for modesetting
39.307] (EE) open /dev/dri/card0: No such file or directory
39.307] (II) Loading sub module "fbdevhw"
39.307] (II) LoadModule: "fbdevhw"
39.307] (II) Loading /usr/lib64/xorg/modules/libfbdevhw.so
39.308] (II) Module fbdevhw: vendor="X.Org Foundation"
39.308]     compiled for 1.20.3, module version = 0.0.2
39.308]     ABI class: X.Org Video Driver, version 24.0
39.308] (EE) Unable to find a valid framebuffer device
39.308] (WW) Falling back to old probe method for fbdev
39.308] (II) Loading sub module "fbdevhw"
39.308] (II) LoadModule: "fbdevhw"
39.308] (II) Loading /usr/lib64/xorg/modules/libfbdevhw.so
39.308] (II) Module fbdevhw: vendor="X.Org Foundation"
39.308]     compiled for 1.20.3, module version = 0.0.2
39.308]     ABI class: X.Org Video Driver, version 24.0
39.308] (II) FBDEV(2): using default device
39.308] (EE) Screen 0 deleted because of no matching config section.
39.308] (II) UnloadModule: "modesetting"
39.308] (EE) Screen 0 deleted because of no matching config section.
39.308] (II) UnloadModule: "fbdev"
39.308] (II) UnloadSubModule: "fbdevhw"
39.308] (EE) 

Fatal server error:
39.308] (EE) Cannot run in framebuffer mode. Please specify busIDs for all framebuffer devices
39.308] (EE)
39.308] (EE)
Please consult the The X.Org Foundation support
at http://wiki.x.org
for help.
39.308] (EE) Please also check the log file at “/var/log/Xorg.0.log” for additional information.
39.309] (EE)
39.313] (EE) Server terminated with error (1). Closing log file.
|
|Offenbar wird der Nouveau Treiber nach kernelupdate doch geladen (trotz blacklist) ??
Oder was habe ich übersehen ?

Vielen Dank im Voraus für Eure Hilfe,
Christoph|

  1. Bitte benutze für Konsolenausgaben Code-Tags, das kleine #

  2. Poste:

zypper se -si kernel nvidia
  1. Versuch es mal mit dem G05 Treiber

  2. Ich hab hier Leap 15.0 aber mit dem Kernel aus kernel:stable und benutze schon lange die run-Datei von der Nvidia Homepage.

Hallo “Sauerland”,

danke für Deine Rückmeldung.
Auch der G05 Treiber liefert den gleichen Fehler, leider.
Die Installation mit dem eigenen Script von NVIDIA wollte ich mir vorerst ersparen und die Reops von Suse verwenden.
Aber falls wir keine andere Ursache finden, so probiere ich es am WE aus (der Rechner ist im beruflichen Einsatz).

Hier schon mal die gewünschte Ausgabe (vielleicht ist da etwas auffällig) :
Ich hatte bislang alle Updates nur mit “zypper dup” erledigt.

AL9000:/home/chris # zypper se -si kernel nvidia
Repository-Daten werden geladen...
Installierte Pakete werden gelesen...

S  | Name                      | Typ   | Version                | Arch   | Repository             
---+---------------------------+-------+------------------------+--------+------------------------
i+ | kernel-default            | Paket | 4.18.15-1.2            | x86_64 | (Systempakete)         
i  | kernel-default-base       | Paket | 4.19.1-1.5             | x86_64 | (Systempakete)         
i+ | kernel-default-devel      | Paket | 4.18.15-1.2            | x86_64 | (Systempakete)         
i+ | kernel-devel              | Paket | 4.19.1-1.5             | noarch | (Systempakete)         
i+ | kernel-devel              | Paket | 4.18.15-1.2            | noarch | (Systempakete)         
i+ | kernel-firmware           | Paket | 20181001-1.1           | noarch | (Systempakete)         
i+ | kernel-macros             | Paket | 4.19.1-1.5             | noarch | (Systempakete)         
i+ | kernel-syms               | Paket | 4.18.15-1.2            | x86_64 | (Systempakete)         
i  | nfs-kernel-server         | Paket | 2.1.1-8.1              | x86_64 | Haupt-Repository (OSS) 
i  | nfs-kernel-server         | Paket | 2.1.1-8.1              | x86_64 | repo-oss               
i+ | nvidia-computeG04         | Paket | 390.87-10.3            | x86_64 | nVidia Graphics Drivers
i+ | nvidia-gfxG04-kmp-default | Paket | 390.87_k4.18.15_1-10.2 | x86_64 | (Systempakete)         
i+ | nvidia-glG04              | Paket | 390.87-10.3            | x86_64 | nVidia Graphics Drivers
i+ | nvidia-texture-tools      | Paket | 2.0.8-3.5              | x86_64 | Haupt-Repository (OSS) 
i+ | nvidia-texture-tools      | Paket | 2.0.8-3.5              | x86_64 | repo-oss               
i+ | pcp-pmda-nvidia-gpu       | Paket | 4.1.1-1.1              | x86_64 | Haupt-Repository (OSS) 
i+ | pcp-pmda-nvidia-gpu       | Paket | 4.1.1-1.1              | x86_64 | repo-oss               
i+ | texlive-l3kernel          | Paket | 2018.158.svn47516-41.1 | noarch | Haupt-Repository (OSS) 
i+ | texlive-l3kernel          | Paket | 2018.158.svn47516-41.1 | noarch | repo-oss               
i+ | texlive-l3kernel-doc      | Paket | 2018.158.svn47516-41.1 | noarch | Haupt-Repository (OSS) 
i+ | texlive-l3kernel-doc      | Paket | 2018.158.svn47516-41.1 | noarch | repo-oss               
i  | x11-video-nvidiaG04       | Paket | 390.87-10.3            | x86_64 | nVidia Graphics Drivers

Hinweis: Für eine erweiterte Suche inkl. nicht momentan aktivierter Remote-Ressourcen bitte 'zypper
search-packages' verwenden.


Viele Grüße und nochmals Dankeschön,
Christoph

Mir ging es mit meiner GTX1050 und openSUSE 42.3 mal ähnlich. Nach etwas Recherche im Web fand ich, dass manche Leute empfahlen, die Standard-User in die Gruppe »video« mit aufzunehmen:

usermod -a -G video *yourusername*

Nach einem Reboot (oder alternativ als root: systemctl isolate graphical.target) gings dann bei mir.
Bin mir nicht sicher, aber ich glaube, ich musste das auch mal seit Leap 15.0 machen; vielleicht funzt der Trick ja auch bei Deinem Tubleweed. Toi toi toi! :slight_smile:

Nachtrag: manchmal bootet man evtl mit einer veralteten initial-RAM-Disk; versuch mal, die momentane initrd neu zu erstellen, evtl gleich ohne Nouveau-Boot-Support, mit:

sudo dracut --omit-drivers nouveau

Liebe Community,

vielen Dank für die zahlreichen Inputs.
Nachdem ich o.g. Ausgabe von “zypper se -si kernel nvidia” gesehen habe, fiel mir auf, dass da wohl einige Versionen nicht zusammengepasst haben,
v.a. die Release von kernel-devel, kernel-macros, kernel-syms scheinten irgendwie nicht zu passen. Vermutlich (ich kann es leider nicht reproduzieren)
ging mal ein Update schief, ohne dass ich es bemerkt habe.
Nachdem ich meine Systemplatte vorsichtshalber mit clonezilla gesichert habe, habe ich folgende Schritte unternommen:
a) Update auf den NVIDIA Treiber Gl05 (hier gab es zunächst immer noch Fehlermeldungen), Rechner bootete nur in Consolen Modus
b) Dann sicherheitshalber zypper up, um alle Anwendungen zu aktialisieren
c) sicherheitshalber auch zypper dup, alle kernel-releases wurden entsprechend aktualisiert
dann reboot.
Und voila … es ging wieder.

Herzlichen Dank an alle, die hier geholfen haben und mich mit den richtigen Tipps und Hinweisen auf die Ursache gebracht haben.
Offensichtlich sind die NVIDIA Treiber immer für eine Überraschung gut.

Ich hoffe, dass dieser Thread auch anderen Mitgliedern helfen wird.
Also immer gut aufpassen auf die kernel-releases :slight_smile:

Vielen Dank an Euch alle,
Christoph

b) Dann sicherheitshalber zypper up, um alle Anwendungen zu aktialisieren

Das sollte man unter Tumbleweed vermeiden bzw. gar nicht mehr anwenden.
Die einzige Möglichkeit um unter Tumbleweed ein Update zu machen ist:

c) sicherheitshalber auch zypper dup, alle kernel-releases wurden entsprechend aktualisiert