다트크리에이티브 IT & CG Magazine

엔비디아, AI 추론 벤치마크 테스트서 새로운 기록 달성

엔비디아는 데이터센터와 네트워크 엣지(edge)에서 AI 추론 워크로드 성능을 측정하는 새로운 벤치마크 테스트에서 가장 빠른 속도를 달성하며,자사의 강력한 기술 역량을 입증했다.

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아가 데이터센터와 네트워크 엣지edge에서 AI 추론 워크로드 성능을 측정하는 새로운 벤치마크 테스트에서 가장 빠른 속도를 달성했다. 이로써, 엔비디아는 지난 7월 MLPerf 벤치마크 테스트 AI 훈련 성능 부문에서 8개의 기록을 세운데 이어, 다시한번 자사의 강력한 기술 역량을 입증했다.

▲ 엔비디아 EGX 엣지 컴퓨팅 플랫폼

업계 최초의 독립적인 AI 추론 벤치마크 테스트인 이번 MLPerf Inference 0.5의 결과는 데이터센터용 엔비디아 튜링Turing GPU와 엣지 컴퓨팅용 엔비디아 젯슨 자비에Jetson Xavier 시스템온칩SoC의 우수한 성능을 명확히 보여준다.

다양한 폼 팩터와 네 가지 추론 시나리오를 적용하는 MLPerf의 다섯 가지 추론 벤치마크는 이미지 분류, 객체 감지 및 변환과 같은 기존 AI 애플리케이션을 포함한다.

엔비디아는 서버 및 오프라인을 포함한 데이터센터 시나리오 상의 5개 벤치마크에서 모두 1위를 차지했으며, 튜링 GPU는 상용 프로세서 중 프로세서당 최고 성능을 달성했다. 젯슨 자비에는 엣지 중심의 시나리오(단일 및 멀티 스트림)에서 상용화된 엣지 및 모바일 SoC 가운데 최고 성능을 기록했다.

이안 벅Ian Buck 엔비디아 가속 컴퓨팅 담당 부사장겸 총괄은 “AI는 현재 연구 단계에서 실제 애플리케이션을 위해 대규모로 구축되는 단계로 접어들면서 전환점을 맞이하고 있다. AI 추론은 컴퓨팅의 중대한 과제이다. 엔비디아는 프로그래밍이 가능한 업계 최고 수준의 가속기, 쿠다-X(CUDA-X) AI 알고리즘 스위트, 그리고 AI 컴퓨팅에 대한 전문지식을 결합하여 데이터센터에 점점 복잡해지고 있는 AI 모델을 원활하게 구축할 수 있도록 돕고 있다”고 설명했다.

엔비디아는 다양한 AI 워크로드에 걸쳐 컴퓨팅 플랫폼의 프로그래밍 가능성과 성능을 입증하면서, 모든 다섯 가지 MLPerf 벤치마크에 결과를 제출한 유일한 기업이었다.

엔비디아 GPU는 알리바바 클라우드Alibaba Cloud, 아마존웹서비스AWS, 구글 클라우드 플랫폼, 마이크로소프트 애저Azure 및 텐센트Tencent 등을 포함한 세계 최대 클라우드 인프라에서 대규모 추론 워크로드를 가속화하는데 활용되고 있다. 또한, 월마트Walmart, 프록터앤드갬블Procter & Gamble과 같은 세계 선도 기업들이 엔비디아의 EGX 엣지 컴퓨팅 플랫폼과 AI 추론 기능을 이용하여 최첨단 AI 워크로드를 실행하고 있다.

엔비디아의 모든 MLPerf 결과는 엔디비아 텐서RT 6(TensorRT 6)를 기반으로 달성됐다. 엔비디아 텐서RT 6는 고성능 딥러닝 추론 소프트웨어로 데이터센터부터 엣지에 이르는 프로덕션 환경에서 AI 애플리케이션을 쉽게 배포 및 최적화한다. 새로운 텐서RT 최적화는 깃허브Github 리포지토리에서 오픈소스로도 이용할 수 있다.

새로운 젯슨 자비에 NX

엔비디아는 또한 새로운 젯슨 자비에 NX(Jetson Xavier NX)를 공개하며 자사의 추론 플랫폼을 확장했다. 젯슨 자비에 NX는 엣지단의 로봇 및 임베디드 컴퓨팅 디바이스를 위한 세계에서 가장 작고 강력한 AI 슈퍼컴퓨터로, MLPerf Inference 0.5 벤치마크에 사용된 자비에 SoC의 저전력 버전이다.

◆ 다트크리에이티브 | 한재현 기자 wowhjh@gmail.com

Facebooktwittermail

DAATKING

멀티미디어, 가상현실&컴퓨터그래픽을 전공한 크리에이티브 디렉터를 지향하는 콘텐츠 제작자겸 저널리스트입니다.
CG 콘텐츠를 제작하는 Media & Entertainment 업계 사람들과 진솔한 이야기와 창의적 지식을 모아서 올바르게 전달하고 소통하도록 노력하겠습니다.

Add comment