국내연구진이 초대규모 인공지능모델을 처리하기 위한 기계학습시스템을 개발했다.
카이스트 김민수교수팀은 20일 기계학습시스템의 성능을 대폭 높일수 있는 행렬연산자융합기술을 개발했다고 밝혔다.
딥러닝모델과 데이터는 컴퓨터클러스터에서 처리하는데 컴퓨터클러스터의 사양에 비해 모델과 데이터의 규모가 커지면 처리에 실패하거나 시간이 오래걸리는 근본적인 문제가 있었다.
지금까지는 더 큰 규모의 모델이나 데이터를 처리하기 위해 단순히 클러스터의 규모를 증가시키는 방식을 주로 사용했다.
연구팀은 모델이나 데이터를 처리하는데서 중간에 중간데이터를 저장하지 않거나 다른 컴퓨터로 전송하지 않도록 여러 행렬연산자들을 하나의 연산자로 융합하는 기술인 FuseME를 개발해 문제를 해결했다.
개발한 시스템을 구글의 텐서플로우나 IBM의 시스템DS와 비교평가한 결과, 딥러닝모델의 처리 속도는 최대 8.8배 높아졌다. 텐서플로우나 시스템DS가 처리할수 없는 초대규모의 모델 및 데이터도 처리하는 데 성공했다.
김민수교수는 <연구팀이 개발한 새로운 기술은 딥러닝 등 기계학습모델의 처리규모와 성능을 크게 높일수 있어 산업적 측면에서 파급효과가 매우 클 것으로 기대한다>라고 말했다.