OpenAI의 새로운 도전, ‘OpenAI 오리온’ AI 모델 출시 임박

인공지능(AI) 분야의 선두주자 OpenAI가 새로운 AI 모델인 ‘OpenAI 오리온(Orion)’을 오는 12월 출시할 예정이라고 합니다. 이 소식은 ChatGPT의 탄생 2주년을 기념하여 발표되었으며, AI 기술 발전의 또 다른 전환점이 될 것으로 기대되고 있습니다.

OpenAI 오리온 모델의 차별점

기존 OpenAI 모델과는 달리, 오리온은 초기 단계에서 ChatGPT를 통해 대중에게 널리 공개되지 않을 예정입니다. 대신, OpenAI는 우선적으로 긴밀히 협력 중인 기업들에게 접근 권한을 제공할 계획입니다. 이를 통해 기업들은 자사의 제품과 서비스를 개발하며 보다 혁신적인 솔루션을 제공할 수 있을 것입니다.

OpenAI의 주요 파트너인 Microsoft에서는 오리온 모델을 Azure에 호스팅할 준비를 하고 있으며, 이르면 11월 중 이를 구현할 계획입니다. 하지만 OpenAI가 이 모델을 외부적으로 ‘GPT-5’로 부를지는 아직 확정되지 않았습니다.

OpenAI 오리온의 기술적 이점

오리온은 내부적으로 GPT-4의 후속 모델로 보이며, 특히 OpenAI의 한 임원이 밝힌 바로는 GPT-4보다 최대 100배 강력할 수 있다고 알려져 화제를 모으고 있습니다. 이는 OpenAI의 오랜 목표인 인공지능의 범용성을 향한 중요한 단계로 평가됩니다.

흥미롭게도, OpenAI는 9월에 출시된 오1(o1)이라는 이름의 모델을 활용하여 OpenAI 오리온을 훈련시키기 위한 합성 데이터를 제공했다고 전해집니다. 연구팀은 최근 오리온 훈련 완료를 축하하는 행사를 열었으며, 이는 오리온 출시에 대한 기대감을 고조시키고 있습니다.

OpenAI의 발전 그리고 도전 과제

새로운 모델 출시는 또한 OpenAI가 최근 성사한 66억 달러 규모의 자금 조달의 일환으로 이뤄졌습니다. 이는 OpenAI가 비영리 기관에서 영리 기업으로 전환하는 중요한 변화를 가져올 것입니다. 다만, 조직 내부의 변화와 인력 유출도 경험하고 있습니다. 최근 중역 몇 명이 퇴사하였는데, 이는 기업의 미래 방향성에 대해 다양한 논의가 필요함을 의미합니다.

openai 오리온

오리온의 출시는 OpenAI가 AI 기술의 최전선에서 어떻게 자리 잡을지에 대한 큰 시험대가 될 것입니다. AI 기술이 빠르게 발전하는 가운데, 기업들은 항상 변화에 대비하고, 이러한 기술을 전략적으로 활용해야 할 것입니다.

결론

OpenAI 오리온은 AI 기술의 혁신을 앞당기는 데 중요한 역할을 할 것입니다. 기업들의 오리온 도입은 제품 개발과 서비스 향상에 집중할 수 있는 새로운 기회를 제공할 것입니다. 기술의 발전이 가져올 변화를 기대하며, 여러분도 AI에 대한 이해를 높이고, 이를 어떻게 활용할지 고민해보는 시간이 되길 바랍니다.

참고: OPENAI PLANS TO RELEASE ITS NEXT BIG AI MODEL BY DECEMBER

함께 읽으면 좋은 글:

디지털 트랜스포메이션: 조직의 습관을 바꾸는 일, 도서 구매

캘리포니아 AI 안전 법안 거부: 뉴섬 주지사의 결정과 그 파급 효과

캘리포니아에서 AI 안전 법안 거부 뉴스가 전해졌습니다. 인공지능(AI)은 최근 몇 년 동안 빠르게 성장하면서 우리의 생활 방식을 근본적으로 변화시키고 있습니다. 그렇다면, AI의 안전성은 어떻게 확보할 수 있을까요? 캘리포니아 주지사 개빈 뉴섬(Gavin Newsom)은 AI 안전 법안인 SB 1047을 거부했습니다. 이번 결정의 배경과 파급 효과를 자세히 파헤쳐 보겠습니다.

왜 SB 1047 법안이 중요한가?

SB 1047 법안, 공식명칭은 ‘프런티어 인공지능 모델을 위한 안전하고 안전한 혁신법(SSIFAI)’는 AI 기업들이 대규모 AI 모델을 출시하기 전에 안전 테스트를 실시하고자 하는 내용이 주를 이룹니다. 특히, 이 법안은 1억 달러 이상의 투자로 개발된 모델에서 “킬 스위치”를 설치하고 극단적인 위험을 테스트 및 완화하는 계획을 공개하도록 요구합니다.

하지만, 뉴섬 주지사는 이 법안이 AI 기업들에게 지나치게 엄격한 요구 조건을 부과하고 있어 혁신을 저해할 수 있다고 판단했습니다.

AI 안전 법안 거부

뉴섬 주지사의 입장

뉴섬 주지사는 “캘리포니아에는 세계적으로 선도적인 AI 기업이 32개 중 무려 50개가 위치해 있다”며, 이 법안이 캘리포니아를 AI 산업에서 멀어지게 할 것이라고 우려했습니다. 또한, 그는 현재 “과학 기반의 실험적 접근 방식을 통해 실질적인 위험을 평가하는 것이 중요하다”고 강조했습니다.

AI 안전 법안 거부, 반대 의견

SB 1047 법안의 주저자인 데모크라티당 상원의원 스콧 위너는 뉴섬의 결정에 대해 깊은 우려를 표했습니다. 그는 “이 법안의 거부는 AI 기업들이 아무런 제약 없이 운영될 수 있다는 현실을 여전히 남겨둡니다”며 국제 무대에서 AI 안전 문제에 대한 논의를 크게 진전시켰다고 말했습니다.

법안의 비판과 지지

법안이 통과되기를 바랐던 많은 이들, 특히 헐리우드 아티스트들은 AI 기술의 사회적 보호가 필요하다고 주장했습니다. 배우 마크 러팔로는 “이 법안이 완벽하진 않지만, AI 산업의 긍정적인 발전을 위한 방향성을 제시한다”며 지지를 보내왔습니다.

반면, 실리콘밸리와 AI 산업 관련자들은 뉴섬의 거부를 환영했습니다. 메타의 최고 AI 과학자 얀 르쿤(Yann LeCun)은 이 법안을 “매우 퇴보적”이라 표현하며 반대 입장을 나타냈습니다.

향후 전망

뉴섬 주지사는 AI 안전 문제에 대한 필요성을 인정하면서도, 더 효과적인 방법을 모색하겠다고 밝혔습니다. AI의 빠른 성장은 분명히 새로운 기회를 창출하지만, 잠재적인 위험 또한 무시할 수 없습니다. AI 정책과 안전성 문제에 대해 활발한 토론과 연구가 지속될 필요가 있습니다.

결론

이번 뉴섬 주지사의 SB 1047 법안 거부는 AI 산업의 혁신성과 안전성 간의 균형을 찾는 것이 얼마나 어려운지 보여줍니다. AI 기술의 잠재력을 극대화하면서도 공공 안전을 확보하기 위한 정책적 접근이 무엇보다 중요합니다. 앞으로 어떤 방식으로 AI 안전 문제가 해결될지, 캘리포니아뿐만 아니라 전 세계가 주목하고 있습니다.

자세한 기사 원문은 여기에서 확인할 수 있습니다.

같이 읽을 수 있는 글 : AI 시스템 Magic Notes 도입으로 영국 사회복지사의 업무 효율성 향상

챗GPT의 비디오 AI 소라(Sora) 공개: 1분 길이 영상도 거뜬

챗GPT를 만든 OpenAI에서 비디오 AI 서비스인 Sora를 공개하였습니다. Text-to-Video, 텍스트를 입력하면 비디오를 만들어주는 방식의 서비스이며, 현재는 일부 크리에이터들에게 공개되었습니다. 최대 1분 정도의 영상을 단순한 프롬프트만으로도 만들 수 있으며, 전 세계 많은 사람들의 관심이 폭발하고 있답니다. 우선 아래 공식 영상부터 먼저 보시지요. AI 대전환의 시대가 점점 더 가속화되는 느낌이랍니다.

Introducing Sora — OpenAI’s text-to-video model

비디오 AI 소라(Sora) 소개

소라(Sora)는 텍스트를 통해 사실적이고 상상력이 풍부한 장면을 만들 수 있는 AI 모델입니다. 이를 위해 OpenAI는 사람들이 실제 상호작용이 필요한 문제를 해결하는 데 도움이 되는 모델을 학습시키는 것을 목표로 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있도록 AI를 교육하였다고 합니다.

비디오 AI, 소라

모델은 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있습니다. 이 모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에 이러한 사물이 어떻게 존재하는지도 이해합니다.

이 모델은 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 감정을 표현하는 매력적인 캐릭터를 생성할 수 있습니다. 또한 소라(Sora)는 하나의 동영상 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 생성할 수 있습니다.

다만, OpenAI는 현재 모델에 약점이 있다고 합니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며, 원인과 결과의 특정 사례를 이해하지 못할 수도 있습니다. 예를 들어, 사람이 쿠키를 한 입 베어 물었지만 나중에 쿠키에 물린 자국이 없을 수 있다고 하네요.

이 모델은 왼쪽과 오른쪽을 혼동하는 등 프롬프트의 공간적 세부 사항을 혼동할 수 있으며 특정 카메라 궤적을 따라가는 것과 같이 시간에 따라 발생하는 이벤트를 정확하게 설명하는 데 어려움을 겪을 수 있다고 합니다.

비디오 AI 소라(Sora) 연구 기법

OpenAI가 밝힌 연구 기법의 상세 소개는 다음과 같습니다. 소라(Sora)는 확산 모델로, 정적 노이즈처럼 보이는 동영상으로 시작하여 여러 단계에 걸쳐 노이즈를 제거하여 점차적으로 변환하는 방식으로 동영상을 생성합니다.

소라(Sora)는 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있습니다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공함으로써 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다고 합니다.

GPT 모델과 마찬가지로 Sora는 트랜스포머 아키텍처를 사용하여 뛰어난 확장 성능을 구현합니다. 동영상과 이미지를 패치라고 하는 작은 데이터 단위의 모음으로 표현하며, 각 패치는 GPT의 토큰과 유사합니다. 데이터를 표현하는 방식을 통합함으로써 다양한 길이, 해상도, 종횡비에 걸쳐 이전보다 더 광범위한 시각 데이터에 대해 확산 변환기를 훈련할 수 있습니다.

소라(Sora)는 DALL-E와 GPT 모델에 대한 과거 연구를 기반으로 합니다. 이 모델은 시각적 학습 데이터에 대해 설명력이 높은 캡션을 생성하는 DALL-E 3의 리캡션 기술을 사용합니다. 그 결과 모델은 생성된 동영상에서 사용자의 텍스트 지시를 보다 충실히 따를 수 있습니다.

이 모델은 텍스트 설명만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 정지 이미지를 가져와서 동영상을 생성할 수 있으며, 이미지의 내용을 정확하고 세세한 부분까지 애니메이션으로 표현할 수 있습니다. 또한 모델은 기존 비디오를 가져와서 확장하거나 누락된 부분을 채울 수도 있습니다.

Sora는 사용자가 입력한 텍스트 설명을 바탕으로 관련된 비디오 클립을 생성합니다. 이는 기존의 텍스트나 이미지 생성 AI와 유사한 방식으로 작동하지만, 동적인 비디오 콘텐츠를 생성한다는 점에서 큰 차이를 보입니다.

이 AI는 다양한 장르와 스타일의 비디오를 생성할 수 있는 능력을 갖추고 있어, 교육용 콘텐츠부터 엔터테인먼트, 광고까지 폭넓은 활용이 가능합니다. 사용자의 요구와 상황에 맞는 맞춤형 비디오 제작이 가능해져, 콘텐츠 제작자들에게 큰 도움이 될 것으로 기대됩니다.

Sora는 최대 1분 길이의 고품질 비디오를 생성할 수 있으며, 이는 기존의 짧은 GIF나 애니메이션 클립을 넘어서는 진보입니다. 이를 통해 보다 복잡하고 내용이 풍부한 비디오 스토리텔링이 가능해집니다.

Sora는 다양한 분야에서 그 활용 가능성을 보여줍니다. 교육 분야에서 Sora는 복잡한 개념이나 이론을 쉽게 설명하는 비디오 콘텐츠 제작에 활용될 수 있습니다. 학생들의 이해를 돕는 생동감 있는 시각 자료를 제공함으로써 교육의 질을 높일 수 있습니다.

마케팅과 광고 분야에서는 Sora를 활용하여 창의적이고 매력적인 광고 비디오를 신속하게 제작할 수 있습니다. 이는 브랜드의 메시지를 효과적으로 전달하고, 타겟 오디언스의 주목을 끌 수 있는 방법이 될 수 있습니다.

엔터테인먼트 분야에서 Sora는 새로운 형태의 스토리텔링과 창작물을 탄생시킬 수 있습니다. 사용자가 상상하는 다양한 시나리오를 비디오로 구현함으로써, 새로운 장르의 콘텐츠 개발이 가능해집니다.

챗GPT의 비디오 AI ‘소라(Sora)’의 공개는 디지털 콘텐츠 제작 분야에 새로운 가능성을 제시합니다. 텍스트 입력만으로 고품질의 비디오를 생성할 수 있는 이 기술은 교육, 마케팅, 엔터테인먼트 등 다양한 분야에서 창의적인 활용이 기대됩니다. ‘Sora’는 디지털 콘텐츠 제작의 미래를 재정의하며, AI 기술의 발전이 우리의 일상과 산업에 어떤 혁신적인 변화를 가져올 수 있는지 보여주고 있습니다.