텐서RT, 음성·비디오·이미지 등 서비스 추론 가속화 기능 갖춰

엔비디아 테슬라 G4 GPU. 사진=엔비디아

[일간투데이 홍정민 기자] 엔비디아는 음성과 비디오, 이미지 및 추천 서비스를 위한 추론 가속화 기능을 제공하는 인공지능(AI) 데이터센터 플랫폼을 출시했다고 14일 밝혔다.

엔비디아 텐서RT 하이퍼스케일 추론 플랫폼은 엔비디아 튜링 아키텍처와 일련의 새로운 추론 소프트웨어를 기반으로 하는 엔비디아 테슬라 T4 GPU로 구성된다. 이 플랫폼은 엔드-투-엔드 앱을 위한 낮은 지연시간과 빠른 성능을 제공한다. 이를 통해 대규모 데이터센터 내에서 향상된 자연어 상호작용과 검색 시 직접 답변을 제공하는 등 새로운 서비스가 가능하다.

대규모 데이터센터는 매일 수십억 건의 음성 쿼리, 번역, 이미지, 비디오, 추천 및 소셜 미디어 상호작용을 처리한다. 각 앱은 이러한 처리가 실행되는 서버에 위치한 서로 다른 유형의 신경 네트워크를 필요로 한다. 엔비디아 텐서RT 하이퍼스케일 플랫폼은 실시간 추론 소프트웨어와 CPU보다 최대 40배 빠른 속도로 쿼리를 처리하는 테슬라 T4 GPU를 통해 데이터 처리량과 서버 활용도를 극대화한다. 

엔비디아는 AI 추론 산업이 향후 5년 내에 200억 달러 규모로 성장할 것으로 예상하고 있다.

이안 벅 엔비디아 가속 컴퓨팅 담당 부사장 겸 총괄은 "우리 고객들은 모든 제품과 서비스가 AI를 통해 향상되고 진화될 미래를 마주하고 있다"며 "엔비디아 텐서RT 하이퍼스케일 플랫폼은 이를 보다 효율적이고 빠른 속도로 구현하기 위해 탄생한 것"이라고 말했다.

저작권자 © 일간투데이 무단전재 및 재배포 금지