Systemfreeze auf Homeserver
Systemfreeze auf Homeserver
da hab ich eine frage. weiß nicht genau ob es hierein passt.
wir betreiben einen homeserver mit debian wheezy auf einen Dual Core mit 4GB ram.
wir benutzen samba als freigabe + minidlna als mediaserver + tvheadend als PVR recorder.
das Phänomen ist das Debian nach ca 2-3 Tagen komplett einfriert..(keine reaktion selbst über konsole) ich habe auch keinen ansatz wo ich anfangen könnte zu suchen wie der fehler auftritt.
memory test lief 3 tage durch ohne fehler.. durch google liest man oft das evtl festplatten probleme machen könnten.
via hdparm habe ich die platten in den standby betrieb geschickt (nach ca 20 min inaktivität) . diese funktion habe ich heute mal deaktiviert zum kontrollieren.
hat jemand vlt eine idee wo man anfangen könnte zu suchen ?
gruß
Christian
wir betreiben einen homeserver mit debian wheezy auf einen Dual Core mit 4GB ram.
wir benutzen samba als freigabe + minidlna als mediaserver + tvheadend als PVR recorder.
das Phänomen ist das Debian nach ca 2-3 Tagen komplett einfriert..(keine reaktion selbst über konsole) ich habe auch keinen ansatz wo ich anfangen könnte zu suchen wie der fehler auftritt.
memory test lief 3 tage durch ohne fehler.. durch google liest man oft das evtl festplatten probleme machen könnten.
via hdparm habe ich die platten in den standby betrieb geschickt (nach ca 20 min inaktivität) . diese funktion habe ich heute mal deaktiviert zum kontrollieren.
hat jemand vlt eine idee wo man anfangen könnte zu suchen ?
gruß
Christian
Zuletzt geändert von Wobliner am 30.11.2014 20:39:24, insgesamt 1-mal geändert.
Re: Systemfreeze auf Homeserver
Mit dem Ursprungsthema hatte das wenig gemein, darum abgetrennt.
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
Re: Systemfreeze auf Homeserver
Hi,
steht nichts in den log-Files? Speziell in /var/log/syslog könntest Du fündig werden.
steht nichts in den log-Files? Speziell in /var/log/syslog könntest Du fündig werden.
Gruß,
Patrick
Patrick
Re: Systemfreeze auf Homeserver
wenn ich wüßte auf was ich achten soll / kann.. auf ne art stop - halt ?
Re: Systemfreeze auf Homeserver
Wenn nach einem Freeze etwas in syslog stehen sollte müsste es schon auffallen. Den Teil kannst Du ja hier posten.
Außerdem kannst Du auch mal die Ausgabe von
posten.
Außerdem kannst Du auch mal die Ausgabe von
Code: Alles auswählen
dmesg | egrep -i "error|fail|warning"
Gruß,
Patrick
Patrick
Re: Systemfreeze auf Homeserver
das zeigt er mir an.. aber sagen tut es mir nichts.
auffällig im systemlog ist nur das er eth1 dauernd versucht einzustellen (board hat 2 netzwerkanschlüsse) eth0 wird nur verwendet
Code: Alles auswählen
root@Heimserver:~# dmesg | egrep -i "error|fail|warning"
[ 0.185133] pci0000:00: ACPI _OSC request failed (AE_NOT_FOUND), returned control mask: 0x1d
[ 5.282511] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
Re: Systemfreeze auf Homeserver
Für mich klingt das nach defekter Hardware. Das kann alles Mögliche sein, von schwankender Spannungsversorgung, über defekte oder kaputte Stromsparmechanismen, bis hin zu unzureichender Systemkühlung. Das hilft dir natürlich nicht weiter, aber vielleicht fällt dir ne Richtung ein, in der du stochern könntest.
Was ist denn das für ein System (CPU, Grafik?). War es früher schon auffällig? Seit wann macht es das?
PVR? Mit eigener TV-Karte? Die Treiber sind oft nicht ganz ausgereift, und stammen aus dem Experimental-Zweig des Kernels. Es mal ohne zu probieren, wäre ein Ansatzpunkt.
Was ist denn das für ein System (CPU, Grafik?). War es früher schon auffällig? Seit wann macht es das?
PVR? Mit eigener TV-Karte? Die Treiber sind oft nicht ganz ausgereift, und stammen aus dem Experimental-Zweig des Kernels. Es mal ohne zu probieren, wäre ein Ansatzpunkt.
Never change a broken system. It could be worse afterwards.
"No computer system can be absolutely secure." Intel Document Number: 336983-001
"No computer system can be absolutely secure." Intel Document Number: 336983-001
Re: Systemfreeze auf Homeserver
Kühlung ist eigentlich ausreichend.(1 Gehäuselüfter 120mm direkt in Rückwand des Gehäuses und in der nähe der CPU - Netzteil hat auch 135 mm ablüfter oberhalb der CPU - 2 Bequiet SIlentwings für den Festplatten Schacht) Dort lief vorher Windows drauf ohne Probleme.
Cpu ist ein Intel(R) Core(TM)2 CPU X6800 @ 2.93GHz
Board ist ein Asus P5B Deluxe (Übertaktung komplett aus. Unter Windows war alles auf leistung eingestellt - per bios). Arbeitsspeicher sind Kingston HyperX PC2-8500 - 4 Riegel je 1 GB laufen derzeit auf 800 Mhz
was beim Ramtest kein Unterschied machte. Netzteil ist ein Bequiet STRAIGHT POWER E9 | 600W (wurde neu gekauft wegen der Plattenanzahl und Grafikkarte)
Boot Platte ist eine Samsung SSD . der Rest sind Sata Platten marke seagate.
TV Karte ist eine Hauppauge hvr-4000 , mit TVheadend funzt das top. ich hatte die nach einer anleitung aus dem Netz installiert. (link könnte ich heraussuchen)
Grafikkarte ist eine GeForce GTS 250 (wird genutzt zum direkten schauen am TV)
es war mal eine ide platte mit drin, die hatte ich zuerst durch sata ersetzt, da das rundkabel irgendwie wackler hatte. im normalen betrieb lief der server dann 2-3 wochen am stück durch.
(da hatte ich auch noch keine automatische abschaltung der platten aktiviert =hdparm) deswegen hab ich seit heut wieder diese funktion deaktiviert.. glaube aber nicht das es daran liegt.. mal abwarten und tee trinken.
Cpu ist ein Intel(R) Core(TM)2 CPU X6800 @ 2.93GHz
Board ist ein Asus P5B Deluxe (Übertaktung komplett aus. Unter Windows war alles auf leistung eingestellt - per bios). Arbeitsspeicher sind Kingston HyperX PC2-8500 - 4 Riegel je 1 GB laufen derzeit auf 800 Mhz
was beim Ramtest kein Unterschied machte. Netzteil ist ein Bequiet STRAIGHT POWER E9 | 600W (wurde neu gekauft wegen der Plattenanzahl und Grafikkarte)
Boot Platte ist eine Samsung SSD . der Rest sind Sata Platten marke seagate.
TV Karte ist eine Hauppauge hvr-4000 , mit TVheadend funzt das top. ich hatte die nach einer anleitung aus dem Netz installiert. (link könnte ich heraussuchen)
Grafikkarte ist eine GeForce GTS 250 (wird genutzt zum direkten schauen am TV)
es war mal eine ide platte mit drin, die hatte ich zuerst durch sata ersetzt, da das rundkabel irgendwie wackler hatte. im normalen betrieb lief der server dann 2-3 wochen am stück durch.
(da hatte ich auch noch keine automatische abschaltung der platten aktiviert =hdparm) deswegen hab ich seit heut wieder diese funktion deaktiviert.. glaube aber nicht das es daran liegt.. mal abwarten und tee trinken.
Re: Systemfreeze auf Homeserver
Dein Mainboard ist "berühmt" ^^
http://www.tomshardware.de/P5B-Deluxe-A ... 39744.html
Hier ärgern sich Anwender über ähnliche Fehler, die anscheinend schleichend anfangen:
http://www.tomshardware.de/foren/239819 ... 2duo-e6600
Wobei deins ja schon lange seinen Dienst verrichtet.
Was mir auffällt:
* du hast nen "JMicron JMB363 PATA and SATA controller" auf dem Board. Die machten bei mir Ärger, wenn ich Sata und Pata parallel betrieb. Das führte bei mir zwar nicht zu Freezes, aber so ganz sauber sind die Controller nicht.
* Hier gibt's Berichte über Kernel Panic mit der HVR-4000 und Kernel 3.2:
https://tvheadend.org/boards/5/topics/9748?r=9844
Da ist von APIC und veralteter Firmware als Ursache die Rede, so richtig schlüssig klingt das aber nicht. Und es sind Panics, keine Freezes.
* Ich hatte mit dem Nvidia-Treiber seit Wheezy derartig viel Ärger, inklusive Freezes, dass ich inzwischen zum Nouveau-Treiber bzw. AMD umgeschwenkt bin.
Joa, mal abwarten, ob es hilft ... wenn ja, schau nach nem aktuellen BIOS. Danach kannst du versuchen, an den Stromspar-Mechanismen der einzelnen Geräte herumzufrickeln, wenn es dir die Mühe wert ist.
http://www.tomshardware.de/P5B-Deluxe-A ... 39744.html
Hier ärgern sich Anwender über ähnliche Fehler, die anscheinend schleichend anfangen:
http://www.tomshardware.de/foren/239819 ... 2duo-e6600
Wobei deins ja schon lange seinen Dienst verrichtet.
Was mir auffällt:
* du hast nen "JMicron JMB363 PATA and SATA controller" auf dem Board. Die machten bei mir Ärger, wenn ich Sata und Pata parallel betrieb. Das führte bei mir zwar nicht zu Freezes, aber so ganz sauber sind die Controller nicht.
* Hier gibt's Berichte über Kernel Panic mit der HVR-4000 und Kernel 3.2:
https://tvheadend.org/boards/5/topics/9748?r=9844
Da ist von APIC und veralteter Firmware als Ursache die Rede, so richtig schlüssig klingt das aber nicht. Und es sind Panics, keine Freezes.
* Ich hatte mit dem Nvidia-Treiber seit Wheezy derartig viel Ärger, inklusive Freezes, dass ich inzwischen zum Nouveau-Treiber bzw. AMD umgeschwenkt bin.
Abgeschaltete Festplatten können in der Folge auch einen einschlafenden Controller und eine einschlafende PCI-E-Lane bedeuten. Und wenn die sich nicht wieder aufwecken lassen, kann es wirklich einen Freeze geben. Ursache sind dann nicht direkt die Festplatten, sondern fehlerhafte Stromspar-Funktionen bzw. fehlerhafte ACPI-Tabellen im BIOS.(da hatte ich auch noch keine automatische abschaltung der platten aktiviert =hdparm) deswegen hab ich seit heut wieder diese funktion deaktiviert.. glaube aber nicht das es daran liegt.. mal abwarten und tee trinken.
Joa, mal abwarten, ob es hilft ... wenn ja, schau nach nem aktuellen BIOS. Danach kannst du versuchen, an den Stromspar-Mechanismen der einzelnen Geräte herumzufrickeln, wenn es dir die Mühe wert ist.
Never change a broken system. It could be worse afterwards.
"No computer system can be absolutely secure." Intel Document Number: 336983-001
"No computer system can be absolutely secure." Intel Document Number: 336983-001
Re: Systemfreeze auf Homeserver
erstmal vielen dank für die interessanten links. Unter Windows gabs bislang keine Probleme (eingesetzte systeme waren dort vista, windows 7)
Der Link zur HVR karte war glaube ich auch die anleitung wie ich vorgegangen bin..
Firmware des Boardes war glaube ich die neuste, aber ich werde da nochmal nachschauen. irgendwo wurde auch erwähnt das du ausschalten von Intel Speedstep verbesserungen erzielt wurden sind, da werde ich auch mal nachschauen.
Melde mich wieder
Der Link zur HVR karte war glaube ich auch die anleitung wie ich vorgegangen bin..
Firmware des Boardes war glaube ich die neuste, aber ich werde da nochmal nachschauen. irgendwo wurde auch erwähnt das du ausschalten von Intel Speedstep verbesserungen erzielt wurden sind, da werde ich auch mal nachschauen.
Melde mich wieder
Re: Systemfreeze auf Homeserver
Bislang läuft er durch : 5 Tage 11 Stunden 11 Minuten
entweder lag es an HDParm , dem Treiber der TV-Karte.. oder das er ständig bei TVHeadend im Idle Modus die Transponder Kanäle abscannt. (bei verbundenem sat kabel) ohne gestecktem sat kabel, mit treiber lief er auch damals durch.. wobei ich glaube dann wieder der treiber der sat karte in die engere auswahl kommt - scheint nicht ganz so einfach zu sein
entweder lag es an HDParm , dem Treiber der TV-Karte.. oder das er ständig bei TVHeadend im Idle Modus die Transponder Kanäle abscannt. (bei verbundenem sat kabel) ohne gestecktem sat kabel, mit treiber lief er auch damals durch.. wobei ich glaube dann wieder der treiber der sat karte in die engere auswahl kommt - scheint nicht ganz so einfach zu sein
Re: Systemfreeze auf Homeserver
so ich mal wieder zurück.. am 6 tag war wieder ende... nachdem komischerweise ich was von einer platte kopiert hatte...
habe diese platte nun mal mit smartctrl überprüft :
Das war auch die platte von der ich kopiert hatte
gruß Chris
habe diese platte nun mal mit smartctrl überprüft :
die letzen 5 fehler machen mich stutzig... weiß jemand die bedeutung ?smartctl -a /dev/sdc
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda LP
Device Model: ST32000542AS
Serial Number: 5XW2DWKE
LU WWN Device Id: 5 000c50 030ec84b8
Firmware Version: CC34
User Capacity: 2.000.398.934.016 bytes [2,00 TB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Sat Dec 13 13:32:01 2014 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 633) seconds.
Offline data collection
capabilities: (0x73) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x103f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 118 075 006 Pre-fail Always - 196628416
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 902
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 077 060 030 Pre-fail Always - 8703492572
9 Power_On_Hours 0x0032 075 075 000 Old_age Always - 22570
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 814
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 001 001 000 Old_age Always - 20944
188 Command_Timeout 0x0032 100 091 000 Old_age Always - 147
189 High_Fly_Writes 0x003a 096 096 000 Old_age Always - 4
190 Airflow_Temperature_Cel 0x0022 069 056 045 Old_age Always - 31 (Min/Max 27/31)
194 Temperature_Celsius 0x0022 031 044 000 Old_age Always - 31 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 052 011 000 Old_age Always - 196628416
197 Current_Pending_Sector 0x0012 100 099 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 099 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 198156906157835
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 2598259757
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 4074318946
SMART Error Log Version: 1
ATA Error Count: 21390 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 21390 occurred at disk power-on lifetime: 8887 hours (370 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 ff ff ff 4f 00 00:12:03.376 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:12:03.376 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:12:03.376 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:12:03.375 READ FPDMA QUEUED
60 00 40 ff ff ff 4f 00 00:12:03.365 READ FPDMA QUEUED
Error 21389 occurred at disk power-on lifetime: 8887 hours (370 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: WP at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
61 00 20 b8 ff 41 40 00 00:11:59.477 WRITE FPDMA QUEUED
61 00 20 98 ff 41 40 00 00:11:59.477 WRITE FPDMA QUEUED
60 00 98 82 60 8b 43 00 00:11:59.477 READ FPDMA QUEUED
60 00 a8 ff ff ff 4f 00 00:11:59.476 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:11:59.476 READ FPDMA QUEUED
Error 21388 occurred at disk power-on lifetime: 8887 hours (370 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 f0 30 8c 63 40 00 00:11:55.613 READ FPDMA QUEUED
60 00 30 30 9c 9e 42 00 00:11:55.604 READ FPDMA QUEUED
60 00 01 5f 9c 9e 42 00 00:11:55.603 READ FPDMA QUEUED
60 00 d0 e0 89 63 40 00 00:11:55.600 READ FPDMA QUEUED
60 00 00 e0 88 63 40 00 00:11:55.600 READ FPDMA QUEUED
Error 21387 occurred at disk power-on lifetime: 8887 hours (370 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 08 ff ff ff 4f 00 00:11:51.521 READ FPDMA QUEUED
60 00 08 ff ff ff 4f 00 00:11:51.515 READ FPDMA QUEUED
61 00 08 ff ff ff 4f 00 00:11:51.503 WRITE FPDMA QUEUED
61 00 20 90 ae d5 41 00 00:11:51.503 WRITE FPDMA QUEUED
61 00 08 ff ff ff 4f 00 00:11:51.503 WRITE FPDMA QUEUED
Error 21386 occurred at disk power-on lifetime: 8887 hours (370 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: WP at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
61 00 20 30 ae d5 41 00 00:11:47.494 WRITE FPDMA QUEUED
61 00 20 10 ae d5 41 00 00:11:47.494 WRITE FPDMA QUEUED
61 00 20 f0 ad d5 41 00 00:11:47.493 WRITE FPDMA QUEUED
60 00 20 ff ff ff 4f 00 00:11:47.493 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 00:11:47.493 READ FPDMA QUEUED
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Das war auch die platte von der ich kopiert hatte
gruß Chris
Re: Systemfreeze auf Homeserver
Eh ... ist der Rechner beim Kopieren abgeschmiert, oder erst danach?
Was mich eher stutzig macht, sind diese abartig hohen Zahlen bei "Raw_Read_Error_Rate" und "Seek_Error_Rate". Das sind Fehler, wo die Festplatte sich verlesen hat, und noch ein zweites mal nachgucken muss. Die erzeugst du am besten, indem du die Platte beim Lesen durchschüttelst. Die "Reported_Uncorrect" sind deutlich kleiner, aber jeder davon ist eine unlesbare Datei.
Die Bedeutung von WP kenne ich nicht, aber UNC sind eben diese "uncorrectable" Fehler, die deine Platte auch reichlich meldet.
Du müsstest diese Fehler auch im dmesg oder syslog finden können.
Kurioser Weise ist der Reallocated Sector Count bei Null, die Platte hält ihre Oberflächen also für völlig heil.
Bevor du jetzt in Panik verfällst, solltest du dich erst mal über die Platte informieren. Diese "raw values" sind mit Vorsicht zu genießen, und manchmal interpretiert smartctl sie falsch. Allerdings hat die Platte auch eine Gesamtbetriebszeit von knapp drei Jahre hinter sich, und die Barracudas sind nicht gerade für den Dauerbetrieb gedacht.
Weiterhin hat Seagate eine lange und traurige Tradition der fehlerhaften Firmwares. Für deine Platte gibt's auch ein Update von CC34 zu CC35:
http://knowledge.seagate.com/articles/e ... Q/213915en
Was genau es damit auf sich hat, krieg ich nicht raus, aber angeblich soll sie den "Seagate click of death" beheben, was wunderbar zu deinen Leseproblemen passen würde.
Wie sich das jetzt ins restliche Problemfeld fügt, das weiß ich nicht, "Eigentlich" sollte Linux bei ner defekten Festplatte nicht abschmieren, sondern dir das dmesg vollschreiben.
Was mich eher stutzig macht, sind diese abartig hohen Zahlen bei "Raw_Read_Error_Rate" und "Seek_Error_Rate". Das sind Fehler, wo die Festplatte sich verlesen hat, und noch ein zweites mal nachgucken muss. Die erzeugst du am besten, indem du die Platte beim Lesen durchschüttelst. Die "Reported_Uncorrect" sind deutlich kleiner, aber jeder davon ist eine unlesbare Datei.
Die Bedeutung von WP kenne ich nicht, aber UNC sind eben diese "uncorrectable" Fehler, die deine Platte auch reichlich meldet.
Du müsstest diese Fehler auch im dmesg oder syslog finden können.
Kurioser Weise ist der Reallocated Sector Count bei Null, die Platte hält ihre Oberflächen also für völlig heil.
Bevor du jetzt in Panik verfällst, solltest du dich erst mal über die Platte informieren. Diese "raw values" sind mit Vorsicht zu genießen, und manchmal interpretiert smartctl sie falsch. Allerdings hat die Platte auch eine Gesamtbetriebszeit von knapp drei Jahre hinter sich, und die Barracudas sind nicht gerade für den Dauerbetrieb gedacht.
Weiterhin hat Seagate eine lange und traurige Tradition der fehlerhaften Firmwares. Für deine Platte gibt's auch ein Update von CC34 zu CC35:
http://knowledge.seagate.com/articles/e ... Q/213915en
Was genau es damit auf sich hat, krieg ich nicht raus, aber angeblich soll sie den "Seagate click of death" beheben, was wunderbar zu deinen Leseproblemen passen würde.
Wie sich das jetzt ins restliche Problemfeld fügt, das weiß ich nicht, "Eigentlich" sollte Linux bei ner defekten Festplatte nicht abschmieren, sondern dir das dmesg vollschreiben.
Never change a broken system. It could be worse afterwards.
"No computer system can be absolutely secure." Intel Document Number: 336983-001
"No computer system can be absolutely secure." Intel Document Number: 336983-001
Re: Systemfreeze auf Homeserver
hab die platte vor ein paar tagen durch eine andere ersetzt.. bislang läuft er wieder 6 tage am stück durch.. vlt hatte die platte auch ne art kurzschluß verursacht ? diese hohen read errors haben mich auch sehr stutzig gemacht.. ich warte noch ein paar tage ab. abgeschmiert war er als 2 personen daten hoch geschoben hatten. (über samba)
Re: Systemfreeze auf Homeserver
Leider hab ich immer noch das Problem des einfrierens... das letze war nun als über wlan drauf zugegriffen wurde (dateien anforderung)
nun hab ich in der interface datei nochmal nachgeschaut und dort die config von eth0 ziemlich minimal eingestellt...
besonders der punkt "allow-hotplug eth0" hat mich etwas zum grübeln gebracht... die funktion schaltet das interface eth0 bei verbindung an und aus ?
habe sie nun erstmal rausgenommen..
desweiteren hab ich nun auch den grafiktreiber von der nvidia seite aufgespielt.. die ist wesentlich neurer, und dort wurden angeblich auch freezes mit xserver behoben.. glaub aber das trifft nicht auf mein problem zu.
wenn das nun auch nichts bringt - kann ich nur noch die neuste bios version vom board flashen, sowie die speedstep funktion noch deaktivieren. Dann wäre ich Ratlos
nun hab ich in der interface datei nochmal nachgeschaut und dort die config von eth0 ziemlich minimal eingestellt...
besonders der punkt "allow-hotplug eth0" hat mich etwas zum grübeln gebracht... die funktion schaltet das interface eth0 bei verbindung an und aus ?
habe sie nun erstmal rausgenommen..
desweiteren hab ich nun auch den grafiktreiber von der nvidia seite aufgespielt.. die ist wesentlich neurer, und dort wurden angeblich auch freezes mit xserver behoben.. glaub aber das trifft nicht auf mein problem zu.
wenn das nun auch nichts bringt - kann ich nur noch die neuste bios version vom board flashen, sowie die speedstep funktion noch deaktivieren. Dann wäre ich Ratlos
Re: Systemfreeze auf Homeserver
@Wobliner
Hängende Server verfolgen mich zur Zeit... Mangels Zeit und Lust konnte ich bei 2 Servern hier zwar noch nicht die exakte Ursache für die Aussetzer (beim einen Netzwerkaussetzer, beim anderen ebenfalls komplette Aufhänger) ermitteln, aber Abhilfe hat jedenfalls ein komplettes Deaktivieren von acpi gebracht. Vielleicht hilft's bei Dir ja auch. Und auf 'nem Server ist aktiviertes acpi eh viertrangig...
mutetella
Hängende Server verfolgen mich zur Zeit... Mangels Zeit und Lust konnte ich bei 2 Servern hier zwar noch nicht die exakte Ursache für die Aussetzer (beim einen Netzwerkaussetzer, beim anderen ebenfalls komplette Aufhänger) ermitteln, aber Abhilfe hat jedenfalls ein komplettes Deaktivieren von acpi gebracht. Vielleicht hilft's bei Dir ja auch. Und auf 'nem Server ist aktiviertes acpi eh viertrangig...
mutetella
Re: Systemfreeze auf Homeserver
Also ich würd ja dringend:
* Das BIOS aktualisieren.
* Die Firmware sämtlicher Seagate-Platten prüfen
* Es mal mit dem Kernel 3.16 aus den Backports versuchen
* Es mal mit dem Nouveau-Treiber versuchen (dazu muss nur das Blacklist des Nouveau-Treibers auskommentiert werden und die xorg.conf umbenannt werden. Der Nvidia-Treiber kann bleiben)
Kannst du im BIOS die Versorgungs-Spannung der CPU erhöhen? Dann mach das mal, um die kleinste mögliche Einheit. Ebenso beim Speicher.
Und wenn du irgendwo noch ein anderes Netzteil rumfliegen hast, dann probiere das mal aus. Nix gegen BeQuiet, solange die laufen, sind sie gut, aber die produzieren auch mal nen Montagsgerät.
* Das BIOS aktualisieren.
* Die Firmware sämtlicher Seagate-Platten prüfen
* Es mal mit dem Kernel 3.16 aus den Backports versuchen
* Es mal mit dem Nouveau-Treiber versuchen (dazu muss nur das Blacklist des Nouveau-Treibers auskommentiert werden und die xorg.conf umbenannt werden. Der Nvidia-Treiber kann bleiben)
Kannst du im BIOS die Versorgungs-Spannung der CPU erhöhen? Dann mach das mal, um die kleinste mögliche Einheit. Ebenso beim Speicher.
Und wenn du irgendwo noch ein anderes Netzteil rumfliegen hast, dann probiere das mal aus. Nix gegen BeQuiet, solange die laufen, sind sie gut, aber die produzieren auch mal nen Montagsgerät.
Never change a broken system. It could be worse afterwards.
"No computer system can be absolutely secure." Intel Document Number: 336983-001
"No computer system can be absolutely secure." Intel Document Number: 336983-001
Re: Systemfreeze auf Homeserver
werde ich ausprobieren... werden nun aber erstmal schauen, ob das was gebracht hatte was ich nun gemacht hatte... (Tage abwarten - Tee Trinken) =)).
Stromspannungen kann ich einstellen... sehe ich derzeit auch über phpsysinfo.. versuche mal die grafik anzuhängen...
Stromspannungen kann ich einstellen... sehe ich derzeit auch über phpsysinfo.. versuche mal die grafik anzuhängen...
Re: Systemfreeze auf Homeserver
7 tage nun am stück sieht ja ganz ok aus... ich warte nochmal ne woche ab...
Re: Systemfreeze auf Homeserver
durch umverlegen des Servers mussten wir ihn heut mal ausschalten bei 13 tagen laufzeit... gehe stark davon aus, das der Grafiktreiber der schuldige war... haben nun auch wieder das sat kabel dran.. nur ausschalten der platten ist noch inaktiv.. da warte ich auch noch erstmal mit
Re: Systemfreeze auf Homeserver
ich hätte da nochmal eine frage wegen der verworfenen pakete über die netzwerkschnitstelle eth0. durch das phpsysinfo zeigt er mir nach längeren betrieb einen sehr hohen wert an.. was mir aufgefallen ist, das der download über den server irgendwie nicht so dolle ist... schwankt so bei 200 - 800 kbit.. (vdsl35 leitung vorhanden) das kopieren auf eine samba freigabe ist dagegen top.. (100 - 112 mb/s).. gibt es da einen ansatz wo ich da mal nach schauen könnte ?
Re: Systemfreeze auf Homeserver
ich denke mal nun das ich sagen kann : die Kernel lösung hatte geholfen... hatten nach umstellung des servers wieder das nach 3 - 4 tage aufhängen symptom... haben dann den kernel 3.16 installiert... nun läuft er ohne probleme... alle features sind wieder an (festplatten nach 30 min inaktivität aus) hauppauge treiber läuft, pvr server läuft, nvidia grafiktreiber auch aufm neusten stand... besten dank schon mal
Die verworfenen pakete sind immer noch.. aber das scheint kein netzwerk problem zu sein (da diese sich nicht erhöhen wenn man was drauf kopiert oder zugreift)
Die verworfenen pakete sind immer noch.. aber das scheint kein netzwerk problem zu sein (da diese sich nicht erhöhen wenn man was drauf kopiert oder zugreift)
Re: Systemfreeze auf Homeserver
Ich kann mit "sehr hohen wert" nichts anfangen, ohne als Vergleich die Anzahl der empfangenen und verschickten Pakete zu kennen. Und das könnte durchaus ein Netzwerkproblem sein, eventuell aber nicht in deiner Wohnung. Ich denke, das wäre einen neuen Thread wert.
Never change a broken system. It could be worse afterwards.
"No computer system can be absolutely secure." Intel Document Number: 336983-001
"No computer system can be absolutely secure." Intel Document Number: 336983-001