Komisches Verhalten nach Neuinstallation von Sarge

Du kommst mit der Installation nicht voran oder willst noch was nachfragen? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
knucklehead23
Beiträge: 105
Registriert: 25.05.2004 09:33:16
Wohnort: /dev/null

Komisches Verhalten nach Neuinstallation von Sarge

Beitrag von knucklehead23 » 31.05.2005 21:22:26

Moinsen,

ich habe auf meinem Fileserver seit mehreren Monaten Sarge laufen und dieses auch regelmäßig per dist-upgrade aktualisiert. Trotz mehrerer Hardwarekomponenten, welche ich nach und nach getauscht habe lief alles problemlos. Vorhin habe ich einen SATA-Controller (Sil3114) eingebaut und die noch vorhandenen PATA-Platten über entsprechende Konverter daran angeschlossen.

Da das System zuerst nicht booten konnte, und ich im Eifer des Gefechts dann auch noch meine initrd geschrottet hatte, habe ich das System per Businesscard-Installer neu aufgesetzt. Als Kernel gleich beim booten 2.6.8 gewählt, lief auch alles problemlos durch. Nur sieht mein Sarge jetzt deutlich anders aus als vorher.

Zum einen habe ich nun anscheinend eine Framebuffer-Konsole (vorher nicht), zum Anderen werden haufenweise Module geladen, auch für Hardware, die überhaupt nicht vorhanden ist (z.B. pdc202xx_new oder amd74xx). Außerdem war für alle Partitionen in der fstab bei "PASS" eine 2 eingetragen, bei den entsprechenden fsck-Durchläufen hagelte es dann Fehlermeldungen, das sich hierbei anscheinend verschiedene Prozesse ins Gehege gekommen sind. Wer kann sich dieses dubiose Verhalten erklären?

Verwendete Hardware:

2* P3 800 (Coppermine)
Tyan S2518NG (ServerWorks III LE)
512MB ECC
Sil3114 SATA-Controller
3com 3C996B-T
30GB + 160GB PATA-Platten mit SATA-Konverter

Verwendete Kernel sind 2.6.8-2-686 und 2.6.8-2-686-smp


MfG

Jan

meti
Beiträge: 559
Registriert: 19.12.2004 14:00:47
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von meti » 01.06.2005 14:29:08

So ein ähnliches Phänomen habe ich bei meinem Sarge auch.

Gestern Abend habe ich wieder mal ein update per aptitude gemacht, dabei wurde auch der Kernel mit ausgetauscht. Es ist der 2.6.8-2-686-smp.

Seit dem Zeitpunkt funktioniert fast kein Download mehr vernünftig, der Rechner legt immer wieder auf.

Eingebaut ist eine Sedlbauer Speedfax +PCI.

Vor diesem Update lief alles absolut Problemlos!

Ich denke da hat der Kernel ein Problem.
Eine der Logmeldungen lautet: Badness in local_bh_enable at kernel/softirq.c:136

Ich hoffe das findet jemand raus. Downloads sind zumindest bei mir fast nicht mehr möglich, weil jedesmal die ISDN-Leitung stirbt und auch sehr schwankenden Durchsatz aufweist.

Gruß
Florian

knucklehead23
Beiträge: 105
Registriert: 25.05.2004 09:33:16
Wohnort: /dev/null

Beitrag von knucklehead23 » 01.06.2005 21:32:43

So, kleines Update:

Eben hat sich mein Server komplett weggehängt: Kein Login mehr per SSH, kein VNC, kein PHP. Lokaler Login war noch möglich, allerdings kam nach der Anmeldung kein Prompt, sondern lediglich ein blinkender Cursor. Bei einem Neustart hat sich das System dann mittendrin auch aufgehängt, letzte Ausgabe war "ohci_hcd: bad entry" oder so ähnlich.

Ist da mit dem aktuellen 2.6.8-Kernel was im Busch?


MfG

Jan

Benutzeravatar
striker2150
Beiträge: 158
Registriert: 23.07.2004 20:46:22

Beitrag von striker2150 » 01.06.2005 23:20:59

Hi @ll

@knucklehead23
Also ich denke mal alle Tyan Techniker die ich kenne würden behaupten es liegt am Board :-)

Nein Spaß bei Seite. Ich habe heute versucht meinen Laptop mit Debian Sarge zu bespielen. Auch mir wurden komische Module angeboten (Centrino Chipset und Debian will Chipsatztreiber für alle möglichen Chipsätze - Sis, Serverworks, etc. -installieren). Leider hatte ich dann Probleme beim Partionieren, daher kann ich nicht sagen welche Module da geladen worden währen.

Aber ich denke mal, dass im Gegensatz zum alten Installer, eher zu viel als zu wenig Module geladen werden. Aber die kannste ja nachträglich noch kicken.

@meti
Am besten auf einem anderen Rechner eine Knoppix brennen, die aktuellen Kernelsourchen saugen, dann den Rechner mit Knoppix booten und einen neuen Kernel bauen und installieren. Ich glaube mich daran erinnern zu können, dass bei mir nach einem Kernelupdate immer mehrere Kernel (neuer und alter) im Bootmanager zur auswahl standen. Kann aber sein, dass ich mehrere Kernel installiert hatte. Aber probier doch einfach mal einen not-SMP Kernel zusätzlich zu installieren, als Backupkernel sozusagen (Rechner muss vorher natürlich wieder laufen).

Eine andere Idee: schalte einmal den Support für ACPI und APIC beim booten aus (Kernel-Parameter noapic noacpi). Ich glaube mich daran erinnern zu können, dass in den Relaesenotes von 2.6.8 drin stand, dass am ACPI Code Änderungen vorgenommen wurden.

bfn

Sascha

meti
Beiträge: 559
Registriert: 19.12.2004 14:00:47
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von meti » 02.06.2005 18:31:35

Auch von mir ein Update:

Ich hab jetzt den Kernel wieder zurückgetauscht. Sprich, den alten -13 statt dem neuen -16 installiert.

Siehe da, ISDN läuft wieder ohne große Unterbrechungen.

Nur, jetzt hab ich etliche zusätzliche Debug-Meldungen auf der Konsole stehen.

Auszug:

Code: Alles auswählen

[<c01251ec>] local_bh_enable+0x8c/0x90
 [<f8b2ed4c>] isdn_ppp_xmit+0x11c/0x8f0 [isdn]
 [<f8b1da9e>] isdn_net_xmit+0x21e/0x270 [isdn]
 [<f8b1dfae>] isdn_net_start_xmit+0x39e/0x3c0 [isdn]
 [<f8dbcf78>] do_bindings+0xa8/0x310 [iptable_nat]
 [<c0242831>] qdisc_restart+0x151/0x220
 [<c023255f>] dev_queue_xmit+0x25f/0x330
 [<c02387a4>] neigh_connected_output+0xb4/0x100
 [<c0254e85>] ip_finish_output2+0x105/0x1d2
 [<c0254d80>] ip_finish_output2+0x0/0x1d2
 [<c0254d80>] ip_finish_output2+0x0/0x1d2
 [<c023cfe4>] nf_hook_slow+0xe4/0x120
 [<c0254d80>] ip_finish_output2+0x0/0x1d2
 [<c0254d50>] dst_output+0x0/0x30
 [<c0252896>] ip_finish_output+0x226/0x230

 [<c0254d80>] ip_finish_output2+0x0/0x1d2
 [<c0254d50>] dst_output+0x0/0x30
 [<c0254d64>] dst_output+0x14/0x30
 [<c023cfe4>] nf_hook_slow+0xe4/0x120
 [<c0254d50>] dst_output+0x0/0x30
 [<c02548ba>] ip_push_pending_frames+0x40a/0x470
 [<c0254d50>] dst_output+0x0/0x30
 [<c0254c8f>] ip_send_reply+0x20f/0x280
 [<c02549f0>] ip_reply_glue_bits+0x0/0x90
 [<f8dbc18b>] ip_nat_used_tuple+0x2b/0x40 [iptable_nat]
 [<f8da1d3b>] invert_tuplepr+0x2b/0x40 [ip_conntrack]
 [<c036bd01>] synchronize_tsc_bp+0x121/0x250
 [<c0269c25>] tcp_v4_send_reset+0xf5/0x170
 [<c026b3b7>] tcp_v4_rcv+0x4a7/0x9c0
 [<f8da12d3>] __ip_conntrack_confirm+0x1c3/0x240 [ip_conntrack]
 [<c024f660>] ip_local_deliver_finish+0x0/0x210
 [<c024f72b>] ip_local_deliver_finish+0xcb/0x210
 [<c024f660>] ip_local_deliver_finish+0x0/0x210
 [<c023cfe4>] nf_hook_slow+0xe4/0x120
 [<c024f660>] ip_local_deliver_finish+0x0/0x210
 [<c024f119>] ip_local_deliver+0x259/0x280
 [<c024f660>] ip_local_deliver_finish+0x0/0x210
 [<c024faab>] ip_rcv_finish+0x23b/0x2c2
 [<c024f870>] ip_rcv_finish+0x0/0x2c2
 [<c024f870>] ip_rcv_finish+0x0/0x2c2
 [<c023cfe4>] nf_hook_slow+0xe4/0x120
 [<c024f870>] ip_rcv_finish+0x0/0x2c2
 [<c024f58f>] ip_rcv+0x44f/0x520
 [<c024f870>] ip_rcv_finish+0x0/0x2c2
 [<c011b9a2>] load_balance+0x42/0x200
 [<c0232b6d>] netif_receive_skb+0x1bd/0x220
 [<c011be9a>] rebalance_tick+0xaa/0xc0
 [<c0232c4d>] process_backlog+0x7d/0x110
 [<c0232d57>] net_rx_action+0x77/0x100
 [<c0125126>] __do_softirq+0xa6/0xb0
 [<c012515d>] do_softirq+0x2d/0x30
 [<c01163d7>] smp_apic_timer_interrupt+0xe7/0x150
 [<c0106cb2>] apic_timer_interrupt+0x1a/0x20
 [<c0104030>] default_idle+0x0/0x40
 [<c010405c>] default_idle+0x2c/0x40
 [<c01040e3>] cpu_idle+0x33/0x40
 [<c036293b>] start_kernel+0x1bb/0x210
 [<c0362370>] unknown_bootoption+0x0/0x160
Badness in local_bh_enable at kernel/softirq.c:136
 [<c01251ec>] local_bh_enable+0x8c/0x90
 [<f8b2ed4c>] isdn_ppp_xmit+0x11c/0x8f0 [isdn]
 [<c011b669>] find_busiest_group+0xe9/0x330
 [<f8b1da9e>] isdn_net_xmit+0x21e/0x270 [isdn]
 [<f8b1dfae>] isdn_net_start_xmit+0x39e/0x3c0 [isdn]
 [<c0242831>] qdisc_restart+0x151/0x220
 [<c0232961>] net_tx_action+0x101/0x150
 [<c01255c0>] ksoftirqd+0x0/0xe0
 [<c0125126>] __do_softirq+0xa6/0xb0
 [<c012515d>] do_softirq+0x2d/0x30
 [<c012563c>] ksoftirqd+0x7c/0xe0
 [<c0135737>] kthread+0xb7/0xc0
 [<c0135680>] kthread+0x0/0xc0
 [<c01042b1>] kernel_thread_helper+0x5/0x14
Ich schau mir mal meine alten Logs durch, aber ich befürchte daß ich da *vielleicht* noch ein zusätzliches Problem hab.

Auf alle Fälle hat der Kernel 2.6.8 mit dem Softirq ein Problem.

Übrigens: das Board ist ein ASUS A7M-266D mit 2 Athlon 1900+ CPU's und 1G RAM

Ich probier noch einen neuen Kernel aus SID.

Antworten