이재진 교수 연구진이 구글∙엔비디아를 뛰어넘는 ‘딥 러닝 컴파일러 프레임워크’를 개발했다.
- 다양한 딥 러닝 모델을 지원하는 GPU 프로그램 생성기 개발
- 공개된 GPU 하드웨어 정보를 사용하여 자동으로 성능 최적화
연구진은 기존에 공개된 GPU 하드웨어 정보만을 사용, 주어진 딥 러닝 모델과 모델을 실행할 GPU에 최적화된 코드를 직접 생성하는 방식으로 고성능을 달성했다.
또 널리 사용되고 있는 여러 개의 딥 러닝 벤치마크 모델(ResNet, BERT 등)에 새 기술을 적용해 테스트한 결과, 구글의 텐서플로우XLA, 엔비디아의 텐서RT, 아파치의 TVM과 같은 최첨단 딥 러닝 컴파일러 프레임워크와 성능이 비슷하거나 더 높은 성능을 달성했다고 밝혔다. 연구진은 개발한 기술을 공개 소프트웨어화할 계획을 갖고 있다.
이 연구 결과는 오는 6월 PLDI(Programming Language Design and Implementation) 2021에 발표될 예정이다.
“A Deep Learning Optimization Framework for Versatile GPU Workloads“, Wookeun Jung, Thanh Tuan Dao, and Jaejin Lee.