다트크리에이티브 IT & CG Magazine

엔비디아, 간단한 단어로 사실적인 예술품 생성하는 AI 페인팅 툴 ‘고갱2’ 공개

엔비디아는 짧은 단어만으로 사실적인 예술품을 만드는 최신의 인공지능 페인팅 툴 ‘고갱2’를 공개했다.

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아는 짧은 단어만으로 사실적인 예술품을 만들어주는 최신 버전의 AI 페인팅 툴 고갱2(GauGAN2)를 24일 공개했다.

엔비디아 고갱2는 간단한 단어와 그림으로 사실적인 예술품을 생성한다

고갱의 딥러닝 모델은 누구나 어느때보다 쉽게 자신의 상상력을 사실적인 그림으로 만들 수 있게 해준다. ‘해변의 일몰’과 같은 문구를 입력하기만 하면 AI가 실시간으로 장면을 생성한다. ‘바위가 많은 일몰의 해변’과 같이 추가 형용사를 추가하거나 일몰을 오후 또는 비오는 날로 바꾸면 고갱이 적대적 생성 신경망(Generative Adversarial Networks, GAN)을 기반으로 즉시 그림을 수정한다.

버튼을 누르면 사용자는 장면에서 개체의 위치를 보여주는 상위 수준의 윤곽선인 세그멘테이션 맵(Segmentation Map)을 생성할 수도 있다. 하늘, 나무, 바위 및 강과 같은 레이블을 사용하여 대략적인 스케치로 장면을 조정하고 그림으로 전환하여 스마트 페인트 브러시가 이러한 낙서를 멋진 이미지로 구현할 수 있게 한다.

새로운 고갱2 텍스트-이미지변환 기능은 엔비디아 리서치(NVIDIA Research)의 최신 엔비디아 AI 데모를 통해 체험할 수 있다. 다양한 텍스트 프롬프트와 스케치를 통해 고갱2는 사용자가 장면을 보다 세밀한 컨트롤과 빠른 장면 커스터마이징을 제공한다.

고갱2는 세그멘테이션 맵, 인페인팅과 텍스트-이미지 생성을 단일 모델에 결합하여 단어와 그림의 혼합을 사실적 예술로 바꾸는 강력한 도구다. 해당 데모는 최초로 단일 GAN 프레임워크 내에서 텍스트, 세멘틱 세그멘테이션(Semantic Segmentation), 스케치 및 스타일과 같은 여러 양식을 하나로 통합한다. 이 기술은 아티스트의 비전을 고품질 AI 생성 이미지로 더 빠르고 쉽게 전환할 수 있도록 돕는다.

상상한 장면의 모든 요소를 그릴 필요 없이 사용자는 ‘눈 덮인 산맥’과 같은 짧은 문구를 입력하여 이미지의 주요 특징과 테마를 빠르게 생성할 수 있다. 시작점은 스케치를 통해 특정 산을 더 높게 만들거나 전경에 몇 그루의 나무를 추가하거나 하늘에 구름을 추가하는 등 사용자 정의 또한 가능하다.

아티스트들은 고갱2를 사용하여 현실기반의 이미지뿐만 아니라 다른 세상의 풍경도 묘사할 수 있다. 예를 들어 두 개의 태양이 있는 스타워즈 시리즈의 상징적인 행성 타투인(Tatooine)의 풍경을 재현하기 위해 필요한 것은 사막, 모래언덕, 해라는 텍스트만으로 시작점을 만들고, 이를 기반으로 사용자는 두 번째 태양을 스케치해 넣을 수 있다.

고갱의 원리는 사용자가 텍스트 상자에 입력하는 모든 단어가 AI 생성 이미지에 더 많은 것을 추가하는 반복적인 과정이다. 고갱2의 AI 모델은 세계에서 가장 강력한 10대 슈퍼컴퓨터 중 하나인 엔비디아 DGX 슈퍼POD(DGX SuperPOD) 기반 엔비디아 셀린(Selene) 슈퍼컴퓨터를 사용해 훈련됐다. 천만 개의 고품질 풍경 이미지와 겨울, 안개 또는 무지개와 같이 단어와 단어가 해당하는 영상 간의 연결을 학습시키는 신경망이 사용됐다.

특히 텍스트-이미지 또는 세그멘테이션 맵-이미지 애플리케이션을 위한 최신 모델에 비해 고갱2의 신경망은 훨씬 다양한 고품질 이미지를 생성한다. 고갱2의 연구 데모는 아티스트를 위한 강력한 이미지 생성 도구의 미래를 보여준다. 엔비디아 RTX GPU가 있는 사람이라면 누구나 다운로드할 수 있는 고갱 기반의 엔비디아 캔버스(Canvas) 애플리케이션이 그 예시다.

엔비디아 리서치는 AI, 컴퓨터 비전, 자율 주행 자동차, 로봇 공학 및 그래픽을 포함한 분야에 중점을 둔 전 세계 200명 이상의 과학자를 보유하고 있다. 여기에서 엔비디아 리서치의 작업에 대해 보다 자세히 알아볼 수 있다.

고갱2 관련영상: https://www.youtube.com/watch?v=5Qdr8AUNYqU&t=1s&ab_channel=NVIDIADeveloper

◈ 다트크리에이티브 | 한재현 기자 wowhjh@gmail.com

DAATKING

멀티미디어, 가상현실&컴퓨터그래픽을 전공한 크리에이티브 디렉터를 지향하는 콘텐츠 제작자겸 저널리스트입니다.
CG 콘텐츠를 제작하는 Media & Entertainment 업계 사람들과 진솔한 이야기와 창의적 지식을 모아서 올바르게 전달하고 소통하도록 노력하겠습니다.

Add comment