챗GPT의 비디오 AI 소라(Sora) 공개: 1분 길이 영상도 거뜬

챗GPT를 만든 OpenAI에서 비디오 AI 서비스인 Sora를 공개하였습니다. Text-to-Video, 텍스트를 입력하면 비디오를 만들어주는 방식의 서비스이며, 현재는 일부 크리에이터들에게 공개되었습니다. 최대 1분 정도의 영상을 단순한 프롬프트만으로도 만들 수 있으며, 전 세계 많은 사람들의 관심이 폭발하고 있답니다. 우선 아래 공식 영상부터 먼저 보시지요. AI 대전환의 시대가 점점 더 가속화되는 느낌이랍니다.

Introducing Sora — OpenAI’s text-to-video model

비디오 AI 소라(Sora) 소개

소라(Sora)는 텍스트를 통해 사실적이고 상상력이 풍부한 장면을 만들 수 있는 AI 모델입니다. 이를 위해 OpenAI는 사람들이 실제 상호작용이 필요한 문제를 해결하는 데 도움이 되는 모델을 학습시키는 것을 목표로 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있도록 AI를 교육하였다고 합니다.

비디오 AI, 소라

모델은 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있습니다. 이 모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에 이러한 사물이 어떻게 존재하는지도 이해합니다.

이 모델은 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 감정을 표현하는 매력적인 캐릭터를 생성할 수 있습니다. 또한 소라(Sora)는 하나의 동영상 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 생성할 수 있습니다.

다만, OpenAI는 현재 모델에 약점이 있다고 합니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며, 원인과 결과의 특정 사례를 이해하지 못할 수도 있습니다. 예를 들어, 사람이 쿠키를 한 입 베어 물었지만 나중에 쿠키에 물린 자국이 없을 수 있다고 하네요.

이 모델은 왼쪽과 오른쪽을 혼동하는 등 프롬프트의 공간적 세부 사항을 혼동할 수 있으며 특정 카메라 궤적을 따라가는 것과 같이 시간에 따라 발생하는 이벤트를 정확하게 설명하는 데 어려움을 겪을 수 있다고 합니다.

비디오 AI 소라(Sora) 연구 기법

OpenAI가 밝힌 연구 기법의 상세 소개는 다음과 같습니다. 소라(Sora)는 확산 모델로, 정적 노이즈처럼 보이는 동영상으로 시작하여 여러 단계에 걸쳐 노이즈를 제거하여 점차적으로 변환하는 방식으로 동영상을 생성합니다.

소라(Sora)는 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있습니다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공함으로써 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다고 합니다.

GPT 모델과 마찬가지로 Sora는 트랜스포머 아키텍처를 사용하여 뛰어난 확장 성능을 구현합니다. 동영상과 이미지를 패치라고 하는 작은 데이터 단위의 모음으로 표현하며, 각 패치는 GPT의 토큰과 유사합니다. 데이터를 표현하는 방식을 통합함으로써 다양한 길이, 해상도, 종횡비에 걸쳐 이전보다 더 광범위한 시각 데이터에 대해 확산 변환기를 훈련할 수 있습니다.

소라(Sora)는 DALL-E와 GPT 모델에 대한 과거 연구를 기반으로 합니다. 이 모델은 시각적 학습 데이터에 대해 설명력이 높은 캡션을 생성하는 DALL-E 3의 리캡션 기술을 사용합니다. 그 결과 모델은 생성된 동영상에서 사용자의 텍스트 지시를 보다 충실히 따를 수 있습니다.

이 모델은 텍스트 설명만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 정지 이미지를 가져와서 동영상을 생성할 수 있으며, 이미지의 내용을 정확하고 세세한 부분까지 애니메이션으로 표현할 수 있습니다. 또한 모델은 기존 비디오를 가져와서 확장하거나 누락된 부분을 채울 수도 있습니다.

Sora는 사용자가 입력한 텍스트 설명을 바탕으로 관련된 비디오 클립을 생성합니다. 이는 기존의 텍스트나 이미지 생성 AI와 유사한 방식으로 작동하지만, 동적인 비디오 콘텐츠를 생성한다는 점에서 큰 차이를 보입니다.

이 AI는 다양한 장르와 스타일의 비디오를 생성할 수 있는 능력을 갖추고 있어, 교육용 콘텐츠부터 엔터테인먼트, 광고까지 폭넓은 활용이 가능합니다. 사용자의 요구와 상황에 맞는 맞춤형 비디오 제작이 가능해져, 콘텐츠 제작자들에게 큰 도움이 될 것으로 기대됩니다.

Sora는 최대 1분 길이의 고품질 비디오를 생성할 수 있으며, 이는 기존의 짧은 GIF나 애니메이션 클립을 넘어서는 진보입니다. 이를 통해 보다 복잡하고 내용이 풍부한 비디오 스토리텔링이 가능해집니다.

Sora는 다양한 분야에서 그 활용 가능성을 보여줍니다. 교육 분야에서 Sora는 복잡한 개념이나 이론을 쉽게 설명하는 비디오 콘텐츠 제작에 활용될 수 있습니다. 학생들의 이해를 돕는 생동감 있는 시각 자료를 제공함으로써 교육의 질을 높일 수 있습니다.

마케팅과 광고 분야에서는 Sora를 활용하여 창의적이고 매력적인 광고 비디오를 신속하게 제작할 수 있습니다. 이는 브랜드의 메시지를 효과적으로 전달하고, 타겟 오디언스의 주목을 끌 수 있는 방법이 될 수 있습니다.

엔터테인먼트 분야에서 Sora는 새로운 형태의 스토리텔링과 창작물을 탄생시킬 수 있습니다. 사용자가 상상하는 다양한 시나리오를 비디오로 구현함으로써, 새로운 장르의 콘텐츠 개발이 가능해집니다.

챗GPT의 비디오 AI ‘소라(Sora)’의 공개는 디지털 콘텐츠 제작 분야에 새로운 가능성을 제시합니다. 텍스트 입력만으로 고품질의 비디오를 생성할 수 있는 이 기술은 교육, 마케팅, 엔터테인먼트 등 다양한 분야에서 창의적인 활용이 기대됩니다. ‘Sora’는 디지털 콘텐츠 제작의 미래를 재정의하며, AI 기술의 발전이 우리의 일상과 산업에 어떤 혁신적인 변화를 가져올 수 있는지 보여주고 있습니다.

ChatGPT의 GPT 스토어 오픈 소식

ChatGPT를 만든 OpenAI에서 지난 개발자 컨퍼런스 발표에서 공언한 GPT 스토어가 드디어 오픈하였습니다. 지난 발표를 한 지 두 달만에 오픈한 것인데요, 사용자들은 이미 3백만 개가 넘는 커스텀한 ChatGPT를 만들었다고 합니다 물론 그 중에는 당장 사용하여 의미 있는 결과물을 얻을 수 있는 것도, 일부는 재미로 만들어본 것들도 있을 것입니다.

그러나 GPT Store가 공식 오픈한 만큼 품질 높은 GPT들이 앞으로 많이 공유될 것으로 기대됩니다. ChatGPT 플러스, 팀 및 엔터프라이즈 사용자에게는 GPT를 찾을 수 있도록 GPT 스토어가 오픈되며, ChatGPT의 GPTs를 방문하면 다양한 커스텀한 GPT들을 확인할 수 있답니다.

OpenAI의 GPT 스토어 오픈
OpenAI의 GPT 스토어 오픈

ChatGPT의 GPT 스토어에서 최신 트렌드 살펴보기

GPT 스토어에는 파트너와 커뮤니티에서 개발한 다양한 GPT가 있습니다. 첫 메인 페이지는 인기있는 GPT를 소개하는 페이지의 역할을 하며, Featured에서는 OpenAI에서 추천한 주목할 GPT, 트렌드를 통해서는 인기있는 GPT, by ChatGPT에서는 OpenAI가 만들어서 공개한 GPT들을 소개하고 있으며, 일반인들이 만든 커스텀 GPT들은 선택한 카테고리별로 또 DALL-E, 글쓰기, 연구, 프로그래밍, 교육, 라이프스타일을 통해서 소개되고 있네요.

Featured 카테고리

Featured 카테고리를 통해 매주 새로운 추천 GPT를 소개한다고 하며, 일반적인 앱스토어와 비슷하게 운영될 것으로 예상됩니다. 참고로 GPT 스토어가 오픈할 때 공개된 추천 GPT들은 다음과 같습니다.

  • 올트레일의 맞춤형 트레일 추천
  • 컨센서스를 통해 2억 개의 학술 논문에서 결과 검색 및 종합하기
  • 코드 튜터, 칸 아카데미의 코드 튜터로 코딩 기술 확장
  • Books로 다음 읽을 책 찾기

한글 GPT

한글 GPT들을 확인하고자 한다면 검색 창에서 관심있는 단어를 입력하는 것으로 확인 가능합니다. 검색 시 나오는 목록 순서는 나름의 인기 순서로 보이기는 합니다.

GPT 스토어의 한글 GPT들
GPT 스토어의 한글 GPT들

앞으로 GPT 스토어를 통해 사람들이 얼마나 ChatGPT의 생태계에 참여할지, 그리고 수익 모델은 어떻게 확대될지 아직은 가야할 길이 많아 보이지만 생태계와 함께간다는 전략은 분명 의미 있는 출발의 시작이라 생각됩니다.

OpenAI 샘 알트만 복귀 임박설

‘OpenAI 샘 알트만 복귀 임박설’ 11월 19일 해임된 ChatGPT를 만든 OpenAI의 CEO 샘 알트만과 공동창업자인 전 사장 그렉 브록먼이 임시 CEO 미라 무라티가 직원들에게 알트만을 초대했다고 말한 후 일요일 샌프란시스코 본사를 방문하였다고 합니다. 샘 알트만은 갑작스러운 해고 통보 이후 새로운 인공 지능(AI) 벤처 설립을 고려하고 있다는 기사들도 쏟아져 나오는 가운데 다시 OpenAI로의 복귀 가능성을 논의하고 있다는 기사도 많이 나왔습니다.

아직까지 OpenAI는 자세한 내용에 대해 논평을 거부하고 있는 가운데 알트만은 일요일 메시징 플랫폼 X에 OpenAI 게스트 배지를 착용한 자신의 사진과 다음의 글을 함께 게시했습니다: “내가 이 배지를 단 것은 처음이자 마지막이다.” 게스트 배지를 달고 회사를 들어가는 것은 처음이자 마지막이라는 이야기지요. 아마도 많은 보도에서 예측하듯이 이번 사태는 샘 알트만의 복귀로 흘러갈 가능성이 현재로써는 높은 것 같습니다.

OpenAI 샘 알트만 복귀 임박설

알트만의 해고 소식에 현직 및 전직 직원들은 분노했고, 갑작스러운 경영 격변으로 인해 다가오는 860억 달러 규모의 주식 매각이 어떤 영향을 받을지 걱정하는 시각도 많았습니다. 오픈AI의 전 사장 겸 공동 창업자인 브록맨도 일요일에 사무실에 도착했다는 기사도 있는 것으로 봐서는 두 사람의 복귀설에 더 무게가 실리는 상황입니다. 참고로 브록먼은 경영진 개편의 일환으로 이사회에서 회장직에서 물러났으며, 금요일에 회사를 그만두겠다고 발표했습니다.

더 인포메이션 기사에 따르면 알트만이 오픈AI로 복귀하면 후원사인 마이크로소프트가 이사회에서 역할을 맡을 것을 고려하고 있다는 기사도 있지만 지금까지의 계약 및 지배구조로상으로 마이크로소프트는 OpenAI의 이사회에 참여하거나 의결권이 없는 이사회 옵서버로 참여할 수 있다고 보고서는 덧붙였습니다.

과연 3일 천하로 끝날 것일까요? 샘 알트만이 복귀한다면 이번 쿠데타(?)를 주도한 내부 세력은 어떻게 될까요? 한국이나 미국이나 기업 정치 상황은 정말 다이나믹한 것 같습니다.