teen.mk.co.kr

2024년 05월 15일 수요일

경제 공부 시사·경제 Cover Story

털끝까지 살아있네 명령어 한마디면 동영상 뚝딱

2024년 03월 18일 목록

인공지능의 진화 어디까지

 

오픈AI가 공개한 인공지능 모델 '소라(Sora)'를 통해 만든 동영상 한 장면.

 

“한 스타일리시한 여성이 따뜻한 네온 불빛과 도시 간판이 가득한 도쿄 거리를 자신감 있고 여유롭게 걷고 있습니다. 검은 가죽 재킷과 긴 붉은 드레스, 검은 부츠, 선글라스를 쓰고 붉은 립스틱을 바르고 있습니다. 거리는 젖어있고 화려한 조명빛이 반사되어 거울 효과를 만들어냅니다. 주위에는 많은 사람들이 걸어다니고 있습니다. ”

 

챗GPT 개발기업인 오픈AI가 ‘텍스트 투 비디오(Text to Video)' AI 모델인 ‘소라(Sora)'를 공개하자 전세계가 들썩였습니다. 실제 촬영한 것처럼 보이는 영상부터 컴퓨터 그래픽(CG)이나 애니메이션으로 보이는 영상까지, ‘이런이런 영상을 만들어 줘'라고 단순히 몇 문장 입력해서 얻어낸 것이라고는 믿기 어려운 수준이었기 때문입니다.

 

사용자가 프롬프트에 간단한 텍스트만 입력하면 소라가 최대 1분 길이 초고화질 동영상을 제작해줍니다. 정지된 이미지를 입력해 동영상을 생성할 수도 있고 기존 동영상을 합성하거나 누락된 프레임을 채우는 일도 가능합니다.

 

오픈AI 측은 “소라가 언어에 대한 깊은 이해를 갖고 있어 입력된 텍스트를 정확하게 해석한 후 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”고 설명했습니다. 또 “사용자가 프롬프트에서 요구한 것들 뿐만 아니라 그것들이 물리적 세계에 어떻게 존재하는지도 이해하고 있다”고 덧붙였습니다.

 

공을 하늘로 던지면 다시 땅으로 떨어지고 유리에 사물이 비춰진다는 것은 인간만이 알고 있는 물리적 세계에 대한 지식입니다. 기존에는 AI가 학습하기 어려운 것들이었습니다.

 

하지만 우리가 태어난 직후부터 현실세계 움직임을 살펴보면서 자연스럽게 물리적 법칙을 받아들이게 되는 것처럼, AI도 많은 동영상을 학습하면 물리적 세계를 이해할 수 있게 된다는 것이 연구자들의 설명입니다. 소라가 생성한 동영상을 살펴보면 현실세계 장면들이 이질감 없이 사실적으로 표현되어 있습니다. 영화나 다큐멘터리에서 실제 촬영한 영상과 구분하기 어려울 정도입니다.

 

오픈AI 연구진은 소라가 AGI(artificial general intelligence, 인공일반지능)로 가는 이정표가 될 것이라며 자신감을 보였습니다. AGI는 모든 상황에 인간처럼 적응해 분야를 가리지 않고 두루 활용할 수 있는 AI를 뜻합니다. 소라처럼 ‘영상 만들기'만 학습하는 게 아니라, 인간이 하는 대부분의 일을 대체할 수 있는 AI입니다.

 

엔비디아 최고경영자(CEO)인 젠슨 황은 최근 “인간처럼 생각하는 AI는 언제쯤 나올까”라는 질문에 5년 이내라고 답했습니다. 그는 “‘인간처럼 생각하는 것'을 어떻게 정의하느냐에 따라 답은 크게 달라진다”면서 “만약 ‘인간의 시험을 통과할 수 있는 능력'으로 정의한다면 인간 수준의 인식을 가진 ‘범용 인공지능(AGI)'의 등장은 멀지 않았다”고 말했습니다.

 

[김혜순 기자]

인쇄하기 페이스북 트위터 카카오스토리 공유하기