오픈AI, 텍스트 입력하면 동영상 만들어주는 AI '소라' 공개

haesun 0 234 2024.02.16 08:34

[시드니=뉴스핌] 권지언 특파원 = 인공지능(AI) 열풍을 주도해 온 챗GPT의 개발사 오픈AI가 텍스트를 기반으로 동영상을 만들어주는 AI '소라(Sora)'를 공개했다.

15일(현지시각) 오픈AI는 자사 홈페이지를 통해 '텍스트 투 비디오(Text to Video)' 모델인 소라를 공개했다. 소라는 텍스트를 입력하면 최대 60초 길이의 현실에 가까운 동영상을 만들어준다.

오픈AI의 '소라'로 만든 동영상 캡처 [사진=오픈AI 사이트] 2024.02.16 [email protected]

오픈AI는 블로그 포스팅을 통해 소라로 생성된 이미지들이 "다양한 캐릭터와 구체적인 움직임, 사물이나 배경의 정확한 디테일을 살린 복잡한 장면들을 담을 수 있다"고 소개했다.

또 소라 시스템이 사용자가 프롬프트에 입력하는 요청사항을 이해할 뿐만 아니라 현실 세계에서 어떻게 존재하는지에 대한 이해도도 갖추고 있다고 강조했다.

소라는 텍스트 설명만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 정지 이미지를 가져와서 동영상을 생성할 수도 있으며, 기존 동영상을 가져와서 확장하거나 누락된 프레임을 채울 수도 있다.

샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 엑스(구 트위터)에 '소라'서비스가 우선은 일부 크레에이터들에게만 오픈 될 예정이며, 전문가로 이뤄진 팀이 소라의 안전성을 점검한 뒤 정식 제품군에 포함시킬 예정이라고 밝혔다.

메타나 알파벳 산하 구글, 런웨이AI 등은 이미 텍스트를 영상으로 만드는 기능들을 개발한 상태로, 컨텐츠 제작 시간은 단축되는 장점이 있는 반면 올해 대선을 앞두고 거짓 정보 확산 등의 문제점이 제기되고 있다.

시장 리서치업체 ABI리서치 선임 애널리스트 리스 헤이든은 멀티모달 AI 모델이 새로운 것이 아니며 텍스트로 이미지를 생성하는 기술도 이미 출시돼 있지만, 오픈AI가 내세우는 소라의 강점은 길이와 정확성에 있다고 설명했다.

헤이든은 이어 아직은 기술이 제한적 수준이나 시장이 어느 방향으로 흘러가는지를 확실히 보여주고 있다면서, 앞으로 디지털 엔터테인먼트 분야에 큰 변화가 예상된다고 덧붙였다.