MPICH Problem auf Phenom Quad-Prozessor

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
besto
Beiträge: 69
Registriert: 26.06.2007 21:05:07
Wohnort: Bremen

MPICH Problem auf Phenom Quad-Prozessor

Beitrag von besto » 19.08.2008 13:19:05

Hallo,

hm, da hab ich so ein schwieriges Problem, was scheinbar sehr selten auftritt. Vorhanden ist ein parallelisiertes Programm, welches schon auf verschiedenen Rechnern und Clustern lief und läuft. Nun habe ich einen neuen Rechner mit folgendem Prozessor (und das 4 mal):
cat /proc/cpuinfo
processor : 0
vendor_id : AuthenticAMD
cpu family : 16
model : 2
model name : AMD Phenom(tm) 9550 Quad-Core Processor
stepping : 3
cpu MHz : 1100.000
cache size : 512 KB
physical id : 0
siblings : 4
core id : 0
cpu cores : 4
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs
bogomips : 4423.64
TLB size : 1024 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate
Darauf läuft ein Debian Lenny:
uname -a
Linux xxx 2.6.25-2-amd64 #1 SMP Mon Jul 14 11:05:23 UTC 2008 x86_64 GNU/Linux
Nun habe ich mein altes parallelisiertes Programm mit mpich neu compiliert (scheinbar erfolgreich) und lasse es laufen. An der Zeile:

Code: Alles auswählen

  MPI_Alltoall(a, msg_size, MPI_BYTE, at, msg_size, MPI_BYTE, MPI_COMM_WORLD);
steigt das Programm aus mit folgender Fehlermeldung:
shandle is 7fff8a8ce6cc
shandle cookie is e0a1beaf
shandle at 22d1a48
cookie = e0a1beaf
is_complete = 0
start = 7f4549630010
bytes_as_contig = 1213440
[0] MPI internal Aborting program Bad address in Rendezvous send (irecv-self)
[0] Bad address in Rendezvous send (irecv-self)
p0_9041: p4_error: : 1
Weiß irgendjemand hier, wie damit umzugehen ist? :|
Lebe so, dass es noch immer o.k. wäre, wenn alle Menschen so leben würden

gms
Beiträge: 7798
Registriert: 26.11.2004 20:08:38
Lizenz eigener Beiträge: MIT Lizenz

Re: MPICH Problem auf Phenom Quad-Prozessor

Beitrag von gms » 19.08.2008 21:18:59

besto hat geschrieben:

Code: Alles auswählen

[0] MPI internal Aborting program Bad address in Rendezvous send (irecv-self)
[0] Bad address in Rendezvous send (irecv-self)
p0_9041:  p4_error: : 1
Weiß irgendjemand hier, wie damit umzugehen ist? :|
nicht wirklich, nachdem das aber ein interner Fehler ist, würde ich es einmal mit einer anderen Runtime probieren. Welche Version setzt du übrigens ein ?

Gruß
gms

besto
Beiträge: 69
Registriert: 26.06.2007 21:05:07
Wohnort: Bremen

Re: MPICH Problem auf Phenom Quad-Prozessor

Beitrag von besto » 20.08.2008 11:27:19

Das ist die library, die in Lenny vorgesehen ist:
mpich 1.2.7.
Das Ganze läuft übrigens unter :
mpiCC /usr/lib/mpich/bin/mpicc --version
g++ (Debian 4.3.1-2) 4.3.1
Copyright (C) 2008 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
Ich hab' dann noch mit openmpi versucht, aber das compiliert dann schon gar nicht mehr.
Lebe so, dass es noch immer o.k. wäre, wenn alle Menschen so leben würden

besto
Beiträge: 69
Registriert: 26.06.2007 21:05:07
Wohnort: Bremen

(gelöst) Re: MPICH Problem auf Phenom Quad-Prozessor

Beitrag von besto » 21.08.2008 15:02:00

Naja, jetzt hab ich mir halt die Quellcodes von mpich-1.2.7p1 runter geladen, compiliert und installiert (nicht ohne vorher die betreffenden Debian Libraries zu entfernen). Jetzt geht's. Nicht optimal, aber behebbar das Problem :wink:
Lebe so, dass es noch immer o.k. wäre, wenn alle Menschen so leben würden

Antworten