pdp 수업시간에 발표해야 돼서 더 꼼꼼히, 자세하게 읽어본 논문저자는 amd researcher, SC24 컨퍼런스에서 발표된 적이 있음30분 안에 발표 가능..? Introduction[trends]복잡한 문제를 풀기 위해 ML 모델의 사이즈는 계속 커지고 있다large ML 모델 등장으로 memory capacity와 compute requirement를 충족시키기 위해 distributed system 발전distributed system에서 ML 모델을 잘 돌리기 위한 parallelization technique들도 많이 등장 예전에는 CPU-GPU heterogeneous system이 왼쪽처럼 단순하게 구성되어 있었음. (CPU 쪽에서 통신을 담당)지금은 HPC/ML에 최적화된 노드 디자인..