123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291 |
- #include "stdio.h"
- #include "stdlib.h"
- #include "mpi.h"
- #include "math.h"
- #define a(x,y) a[x*M+y]
- #define b(x) b[x]
- #define A(x,y) A[x*M+y]
- #define B(x) B[x]
- #define floatsize sizeof(float)
- #define intsize sizeof(int)
- int M;
- int N;
- int m;
- float *A;
- float *B;
- double starttime;
- double time1;
- double time2;
- int my_rank;
- int p;
- int l;
- MPI_Status status;
- void fatal(char *message)
- {
- printf("%s\n",message);
- exit(1);
- }
- void Environment_Finalize(float *a,float *b,float *x,float *f)
- {
- free(a);
- free(b);
- free(x);
- free(f);
- }
- int main(int argc, char **argv)
- {
- int i,j,t,k,my_rank,group_size;
- int i1,i2;
- int v,w;
- float temp;
- int tem;
- float *sum;
- float *f;
- float lmax;
- float *a;
- float *b;
- float *x;
- int *shift;
- FILE *fdA,*fdB;
- MPI_Init(&argc,&argv);
- MPI_Comm_size(MPI_COMM_WORLD,&group_size);
- MPI_Comm_rank(MPI_COMM_WORLD,&my_rank);
- p=group_size;
- if (my_rank==0)
- {
- starttime=MPI_Wtime();
- fdA=fopen("dataIn.txt","r");
- fscanf(fdA,"%d %d", &M, &N);
- if (M != N-1)
- {
- printf("the input is wrong\n");
- exit(1);
- }
- A=(float *)malloc(floatsize*M*M);
- B=(float *)malloc(floatsize*M);
- for(i = 0; i < M; i++)
- {
- for(j = 0; j < M; j++)
- {
- fscanf(fdA,"%f", A+i*M+j);
- }
- fscanf(fdA,"%f", B+i);
- }
- fclose(fdA);
- }
- MPI_Bcast(&M,1,MPI_INT,0,MPI_COMM_WORLD); /* 0号处理机将M广播给所有处理机 */
- m=M/p;
- if (M%p!=0) m++;
- f=(float*)malloc(sizeof(float)*(M+1)); /* 各处理机为主行元素建立发送和接收缓冲区(M+1) */
- a=(float*)malloc(sizeof(float)*m*M); /* 分配至各处理机的子矩阵大小为m*M */
- b=(float*)malloc(sizeof(float)*m); /* 分配至各处理机的子向量大小为m */
- sum=(float*)malloc(sizeof(float)*m);
- x=(float*)malloc(sizeof(float)*M);
- shift=(int*)malloc(sizeof(int)*M);
- if (a==NULL||b==NULL||f==NULL||sum==NULL||x==NULL||shift==NULL)
- fatal("allocate error\n");
- for(i=0;i<M;i++)
- shift[i]=i;
- /*
- 0号处理机采用行交叉划分将矩阵A划分为大小为m*M的p块子矩阵,将B划分为大小
- 为m的p块子向量,依次发送给1至p-1号处理机
- */
- if (my_rank==0)
- {
- for(i=0;i<m;i++)
- for(j=0;j<M;j++)
- a(i,j)=A(i*p,j);
- for(i=0;i<m;i++)
- b(i)=B(i*p);
- }
- if (my_rank==0)
- {
- for(i=0;i<M;i++)
- if ((i%p)!=0)
- {
- i1=i%p;
- i2=i/p+1;
- MPI_Send(&A(i,0),M,MPI_FLOAT,i1,i2,MPI_COMM_WORLD);
- MPI_Send(&B(i),1,MPI_FLOAT,i1,i2,MPI_COMM_WORLD);
- }
- } /* my_rank==0 */
- else /* my_rank !=0 */
- {
- for(i=0;i<m;i++)
- {
- MPI_Recv(&a(i,0),M,MPI_FLOAT,0,i+1,MPI_COMM_WORLD,&status);
- MPI_Recv(&b(i),1,MPI_FLOAT,0,i+1,MPI_COMM_WORLD,&status);
- }
- }
- time1=MPI_Wtime(); /* 开始计时 */
- for(i=0;i<m;i++) /* 消去 */
- for(j=0;j<p;j++)
- {
- if (my_rank==j) /* j号处理机负责广播主行元素 */
- {
- v=i*p+j; /* 主元素在原系数矩阵A中的行号和列号为v */
- lmax=a(i,v);
- l=v;
- for(k=v+1;k<M;k++) /* 在同行的元素中找最大元,并确定最大元所在的列l */
- if (fabs(a(i,k))>lmax)
- {
- lmax=a(i,k);
- l=k;
- }
- if (l!=v) /* 列交换 */
- {
- for(t=0;t<m;t++)
- {
- temp=a(t,v);
- a(t,v)=a(t,l);
- a(t,l)=temp;
- }
- tem=shift[v];
- shift[v]=shift[l];
- shift[l]=tem;
- }
- for(k=v+1;k<M;k++) /* 归一化 */
- a(i,k)=a(i,k)/a(i,v);
- b(i)=b(i)/a(i,v);
- a(i,v)=1;
- for(k=v+1;k<M;k++)
- f[k]=a(i,k);
- f[M]=b(i);
- /* 发送归一化后的主行 */
- MPI_Bcast(&f[0],M+1,MPI_FLOAT,my_rank,MPI_COMM_WORLD);
- /* 发送主行中主元素所在的列号 */
- MPI_Bcast(&l,1,MPI_INT,my_rank,MPI_COMM_WORLD);
- }
- else
- {
- v=i*p+j;
- MPI_Bcast(&f[0],M+1,MPI_FLOAT,j,MPI_COMM_WORLD);
- MPI_Bcast(&l,1,MPI_INT,j,MPI_COMM_WORLD);
- if (l!=v)
- {
- for(t=0;t<m;t++)
- {
- temp=a(t,v);
- a(t,v)=a(t,l);
- a(t,l)=temp;
- }
- tem=shift[v];
- shift[v]=shift[l];
- shift[l]=tem;
- }
- }
- if (my_rank<=j)
- for(k=i+1;k<m;k++)
- {
- for(w=v+1;w<M;w++)
- a(k,w)=a(k,w)-f[w]*a(k,v);
- b(k)=b(k)-f[M]*a(k,v);
- }
- if (my_rank>j)
- for(k=i;k<m;k++)
- {
- for(w=v+1;w<M;w++)
- a(k,w)=a(k,w)-f[w]*a(k,v);
- b(k)=b(k)-f[M]*a(k,v);
- }
- } /* for i j */
- for(i=0;i<m;i++)
- sum[i]=0.0;
- for(i=m-1;i>=0;i--) /* 回代 */
- for(j=p-1;j>=0;j--)
- if (my_rank==j)
- {
- x[i*p+j]=(b(i)-sum[i])/a(i,i*p+j);
- MPI_Bcast(&x[i*p+j],1,MPI_FLOAT,my_rank,MPI_COMM_WORLD);
- for(k=0;k<i;k++)
- sum[k]=sum[k]+a(k,i*p+j)*x[i*p+j];
- }
- else
- {
- MPI_Bcast(&x[i*p+j],1,MPI_FLOAT,j,MPI_COMM_WORLD);
- if (my_rank>j)
- for(k=0;k<i;k++)
- sum[k]=sum[k]+a(k,i*p+j)*x[i*p+j];
- if (my_rank<j)
- for(k=0;k<=i;k++)
- sum[k]=sum[k]+a(k,i*p+j)*x[i*p+j];
- }
- if (my_rank!=0)
- for(i=0;i<m;i++)
- MPI_Send(&x[i*p+my_rank],1,MPI_FLOAT,0,i,MPI_COMM_WORLD);
- else
- for(i=1;i<p;i++)
- for(j=0;j<m;j++)
- MPI_Recv(&x[j*p+i],1,MPI_FLOAT,i,j,MPI_COMM_WORLD,&status);
- if (my_rank==0)
- {
- printf("Input of file \"dataIn.txt\"\n");
- printf("%d\t%d\n", M, N);
- for(i=0;i<M;i++)
- {
- for(j=0;j<M;j++) printf("%f\t",A(i,j));
- printf("%f\n",B(i));
- }
- printf("\nOutput of solution\n");
- for(k=0;k<M;k++)
- {
- for(i=0;i<M;i++)
- {
- if (shift[i]==k) printf("x[%d]=%f\n",k,x[i]);
- }
- }
- }
- time2=MPI_Wtime();
- if (my_rank==0)
- {
- printf("\n");
- printf("Whole running time = %f seconds\n",time2-starttime);
- printf("Distribute data time = %f seconds\n",time1-starttime);
- printf("Parallel compute time = %f seconds\n",time2-time1);
- }
- MPI_Finalize();
- Environment_Finalize(a,b,x,f);
- return(0);
- }
|