hm, da hab ich so ein schwieriges Problem, was scheinbar sehr selten auftritt. Vorhanden ist ein parallelisiertes Programm, welches schon auf verschiedenen Rechnern und Clustern lief und läuft. Nun habe ich einen neuen Rechner mit folgendem Prozessor (und das 4 mal):
Darauf läuft ein Debian Lenny:cat /proc/cpuinfo
processor : 0
vendor_id : AuthenticAMD
cpu family : 16
model : 2
model name : AMD Phenom(tm) 9550 Quad-Core Processor
stepping : 3
cpu MHz : 1100.000
cache size : 512 KB
physical id : 0
siblings : 4
core id : 0
cpu cores : 4
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs
bogomips : 4423.64
TLB size : 1024 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate
Nun habe ich mein altes parallelisiertes Programm mit mpich neu compiliert (scheinbar erfolgreich) und lasse es laufen. An der Zeile:uname -a
Linux xxx 2.6.25-2-amd64 #1 SMP Mon Jul 14 11:05:23 UTC 2008 x86_64 GNU/Linux
Code: Alles auswählen
MPI_Alltoall(a, msg_size, MPI_BYTE, at, msg_size, MPI_BYTE, MPI_COMM_WORLD);
Weiß irgendjemand hier, wie damit umzugehen ist?shandle is 7fff8a8ce6cc
shandle cookie is e0a1beaf
shandle at 22d1a48
cookie = e0a1beaf
is_complete = 0
start = 7f4549630010
bytes_as_contig = 1213440
[0] MPI internal Aborting program Bad address in Rendezvous send (irecv-self)
[0] Bad address in Rendezvous send (irecv-self)
p0_9041: p4_error: : 1