스탠포드 대학의 AI Index Report 2024 공개

스탠포드 대학의 2024 AI Index Report입니다. 500페이지가 넘는 보고서로 AI의 다양한 주제에 대해 다루고 있답니다. 보고서에서 이야기하는 10가지 주요 메시지는 다음과 같습니다. 다음 링크로 접속하셔서 다운로드해 보세요~

AI Index Report


AI Index Report 2024 주요 내용

1. AI는 일부 작업에서 인간을 능가하지만 모든 작업에서 인간을 능가하지는 않습니다.
AI는 이미지 분류, 시각적 추론, 영어 이해 등 몇 가지 벤치마크에서 인간의 성능을 능가했습니다. 그러나 경쟁 수준의 수학, 시각적 상식 추론 및 계획과 같은 더 복잡한 작업에서는 뒤처지고 있습니다.

2. 산업계가 계속해서 프론티어 AI 연구를 주도하고 있습니다.
2023년에 산업계는 51개의 주목할 만한 머신러닝 모델을 개발한 반면, 학계는 15개만 기여했습니다. 또한 2023년에는 산학 협력을 통해 21개의 주목할 만한 모델이 탄생했으며, 이는 최고치입니다.

3. 프론티어 모델이 훨씬 더 비싸집니다.
AI Index의 추정에 따르면, 최첨단 AI 모델의 학습 비용은 전례 없는 수준에 도달했습니다. 예를 들어 OpenAI의 GPT-4는 훈련에 약 7,800만 달러 상당의 컴퓨팅을 사용한 반면, Google의 Gemini Ultra는 1억 9,100만 달러의 컴퓨팅 비용이 들었습니다.

4. 미국은 중국, EU, 영국을 제치고 최고의 AI 모델 보유국으로 선두를 달리고 있습니다.
2023년에 주목할 만한 AI 모델 중 61개가 미국 소재 기관에서 개발되어 유럽연합의 21개와 중국의 15개를 훨씬 앞질렀습니다.

5. LLM 책임에 대한 강력하고 표준화된 평가가 심각하게 부족합니다.
AI 인덱스의 새로운 연구에 따르면 책임 있는 AI 보고에 대한 표준화가 크게 부족한 것으로 나타났습니다. OpenAI, Google, Anthropic을 비롯한 선도적인 개발자들은 주로 다양한 책임감 있는 AI 벤치마크를 기준으로 모델을 테스트합니다. 이러한 관행은 위험을 체계적으로 비교하려는 노력을 복잡하게 만듭니다.



6. 제너레이티브 AI 투자 급증.
지난해 전체 AI 민간 투자가 감소했음에도 불구하고, 제너레이티브 AI에 대한 투자는 급증하여 2022년 대비 10배 가까이 증가한 252억 달러에 달했습니다. OpenAI, Anthropic, Hugging Face, Inflection 등 제너레이티브 AI 분야의 주요 업체들이 상당한 규모의 펀드레이징 라운드를 진행했다고 보고했습니다.

7. 데이터가 들어옵니다: AI는 근로자의 생산성을 높이고 더 높은 품질의 업무로 이어집니다.
2023년, 여러 연구에서 AI가 노동에 미치는 영향을 평가한 결과, AI를 통해 근로자가 작업을 더 빨리 완료하고 결과물의 품질을 향상시킬 수 있다는 사실이 밝혀졌습니다. 이 연구들은 또한 저숙련 근로자와 고숙련 근로자 간의 기술 격차를 해소할 수 있는 AI의 잠재력을 보여주었습니다. 또 다른 연구에서는 적절한 감독 없이 AI를 사용하면 성과가 저하될 수 있다고 경고합니다.

8. AI 덕분에 과학적 진보가 더욱 가속화됩니다.
2022년, AI는 과학적 발견을 발전시키기 시작했습니다. 그러나 2023년에는 알고리즘 분류를 더욱 효율적으로 만드는 AlphaDev부터 물질 발견 과정을 용이하게 하는 GNoME에 이르기까지 훨씬 더 중요한 과학 관련 AI 애플리케이션이 출시될 예정입니다.

9. 미국의 AI 규제 수 급격히 증가.
미국의 AI 관련 규제는 작년과 지난 5년 동안 크게 증가했습니다. 2016년 한 개에 불과했던 AI 관련 규제는 2023년에 25개로 증가했습니다. 작년에만 AI 관련 규제의 총 수가 56.3% 증가했습니다.

10. 전 세계 사람들은 AI의 잠재적 영향력을 더 잘 인식하고 있으며, 더 긴장하고 있습니다.
입소스의 설문조사에 따르면, 지난 1년간 AI가 향후 3~5년 내에 자신의 삶에 큰 영향을 미칠 것이라고 생각하는 사람의 비율이 60%에서 66%로 증가했습니다. 또한 52%는 AI 제품 및 서비스에 대해 불안감을 표명했는데, 이는 2022년에 비해 13% 포인트 증가한 수치입니다. 미국에서는 퓨 데이터에 따르면 미국인의 52%가 AI에 대해 기대감보다 우려를 더 많이 느낀다고 답해 2022년의 38%보다 증가했습니다.

AI Index Report 2024 맺음말

AI 산업은 우리가 인식하고, 학습하는 속도보다 더 빠르게 변화하고 있습니다. AI를 둘러싼 기술부터 이를 지원할 인프라까지 상당히 많은 변화와 사회적 투자, 합의를 필요합니다. 다양한 정보들이 쏟아져 나오고 있는 상황이지만 의미 있는 정보들을 잘 걸러 여러분만의 필터를 만들어 보세요.

AI 이미지 사이트 베스트 7, 미드저니부터 DALL-E까지

챗GPT가 세상에 소개된 지 1년 조금 지났습니다만 그 사이 생성형 AI 기술은 실제 기술을 다루는 사람들에게도 그 속도를 쫓아갈 수 없을 정도로 빠르게 변화하였습니다. 챗봇도 물론 혁신적이지만 많은 사람들이 AI 이미지 서비스들을 보면서 놀라움을 금치 못하고 있답니다. 물론 하나의 글을 가지고 AI 이미지 분야를 모두 이해한다는 것은 현실적으로 어려우나 아주 기초적인 내용으로 가볍게 읽어보시면 좋겠습니다. 디지털 트랜스포메이션의 하나인 AI 전환이 현대를 살아가는 모든 사람들에게 해당되며, 이 글을 통해 그 개념을 조금이나마 공감하면 좋겠습니다.

인공지능 시대의 도래

OpenAI의 챗GPT를 시작으로, 마이크로소프 코파일럿, 구글의 제미나이, 이외에 다양한 인공지능 서비스들이 홍수처럼 쏟아지고 있습니다. 인공지능이 당장의 우리의 일자리를 빼앗지는 않겠지만 앞으로 사무직군의 경우에는 인공지능으로 인해 여러 일자리를 위협 받는다는 뉴스는 이미 여러 곳에서 소개되었습니다. 저 또한 이러한 흐름에는 동의하고, 실제로 반영될 것입니다.

그러나 이 맥락을 조금만 더 깊게 곱씹어보면 인공지능을 잘 활용하는 사람들이 그렇지 못한 사람들을 대체할 가능성이 높다고 생각합니다. 앞으로 직장 생활을 잘 한다는 것은 지금의 컴퓨터와 다양한 오피스 프로그램을 다루는 것처럼 인공지능을 잘 다뤄야 한다는 것을 의미하는 날이 멀지 않았습니다. 너무나 급격하게 변화지만 하나씩 실제 업무에 적용해보고, 고민해보면 좋겠습니다.

AI 이미지 사례

인공지능은 이미 우리가 상상하는 능력을 뛰어넘고 있습니다. 다음의 인공지능이 그린 이미지들을 보시지요. 실제와 구분할 수 없을 정도의 AI 이미지 서비스들도 이미 많은 사람들이 사용하고 있습니다. 대표적으로 미드저니나 OpenAI의 DALL-E, 마이크로소프트의 빙 이미지 크리에이터까지 쉽게 활용할 수 있답니다. 앞서 인공지능을 사용하는 사람들에 의해 대체될 수 있다는 분야 중 사진과 그래픽을 만드는 분야도 예외는 아닐 것 같습니다. 다만, 제대로 된 AI 이미지를 만드려면 한두번의 프롬프트로는 가능하지 않고, 나름의 전문적인 지식과 경험이 필요하답니다.

AI 이미지

위의 이미지를 보면 어떤가요? AI 이미지인지 실제 촬용한 사진인지 쉽게 구분이 되나요? 다음 이미지도 한번 보시지요. 역사속의 인물들이 셀카 찍는 장면을 연출한 AI 이미지입니다. 정말 놀랍지 않나요?

AI 이미지

다음의 AI 이미지도 한번 보시지요. 만일 다음과 같은 이미지를 실제 촬영한다거나 아니면 컴퓨터 그래픽으로 만든다고 하면 아마도 상당한 고가 장비를 사용하거나 아니면 오랜 시간 컴퓨터 작업이 필요한 품질의 이미지들입니다.

AI 이미지

AI 이미지 생성 사이트

최근 많은 사람들의 관심을 받고 있는 인공지능 이미지를 만들 수 있는 생성 사이트들입니다.

1) 미드저니

인공지능 이미지 생성 사이트 중에 가장 고품질의 이미지를 만들 수 있는 곳입니다만 이제는 무료로 사용할 수 없다는 단점이 있습니다. 단, 인공지능 이미지의 대표선수이니 꼭 살펴보세요.

미드저니

2) DALL-E (OpenAI)

챗GPT를 사용하는 분들이라면 DALL-E도 한번 이상은 들어보셨을 것입니다. 이전에는 별도의 서비스로 있었지만 이제는 GPT4를 활용할 때 기본으로 사용할 수 있답니다. 프롬프트에 이미지를 만들어 달라고하면 내부적으로 DALL-E 모델이 동작하면서 이미지를 만들어 줍니다.

DALL-E 이미지

3) 마이크로소프트 Copilot GPT – Designer

빙 챗 이미지 크리에이터라고 불리는 마이크로소프트의 코파일럿의 기능의 하나입니다. 마찬가지로 이미지를 쉽게 만들어 줍니다.

마이크로소프트 빙 챗

4) Playground

현재는 하루에 500개 이미지를 만들 수 있고, 상용으로도 사용할 수 있다고 합니다. 유료 모델이 있으니 이는 사이트를 통해서 확인해 보세요.

Playground

5) Canva

Canva의 AI 이미지 생성 도구는 로고, 포스터, 소셜 미디어 콘텐츠 등 다양한 디자인 작업에 활용될 수 있습니다. 사용자 친화적인 인터페이스와 다양한 템플릿이 특징입니다. 로고 작업이나 여러 템플릿을 바탕으로 다양한 이미지를 만들어볼 수 있답니다.

6) Adobe Firefly

포토샵으로 유명한 어도비 또한 인공지능 이미지 분야에서 빠질 수 없답니다. 실제 그래픽 디자이너들이 어떻게 인공지능을 활용하여 작업할 수 있을지 다양한 영감과 손쉽게 활용할 수 있도록 서비스를 제공하고 있답니다. 어도비의 Firefly는 전문 그래픽 디자이너들을 위한 강력한 AI 이미지 생성 도구입니다. 포토샵과의 연동을 통해 더욱 향상된 작업 효율을 경험할 수 있습니다. 앞서 다양한 서비스들처럼 프롬프트를 활용해서 이미지를 생성하는 것부터, 이미지의 부족한 부분을 AI로 채우기, 배경 제거하기, 스케치를 가지고 이미지 만들기 등 정말 많은 사례들이 있으니 꼭 방문하셔서 살펴보시면 좋겠습니다.

Adobe Firefly

7) freeflo: 생성형 AI를 만드는 방법이 궁금할 때

다양한 AI 이미지 서비스들을 통해서 만든 이미지를 볼 때마다 어떻게 만들었을지 궁금할텐데 이런 이미지들을 공유하고, 프롬프트를 확인할 수 있는 사이트가 있답니다. 바로 freeflo 서비스로 사이트를 통해서 원하는 이미지 분위기를 검색해서 프롬프트를 확인하면 이를 다양한 서비스에서 직접 입력하여 결과를 확인 가능합니다.

freeflo

이외에도 대표적인 이미지 생성 서비스로 스테이블 디퓨전을 비롯하여 많이 있습니다. 그러나 어떤 서비스든 자신의 목적에 맞도록 서비스 하나를 선택해서 자주 사용하는 것이 이 인공지능, 특히 생성형 인공지능 분야를 이해하는데 도움이 될 것입니다. 마지막으로 생성형 AI의 프롬프트를 만드는 팁 하나 알려 드립니다. 잠시 전에 보셨던 freeflo 같은 곳에서 찾아볼 수도 있지만 이미지에 대해서 설명해주는 AI 서비스를 활용하는 것도 좋은 방법입니다.

예를 들어, 챗GPT에 특정 이미지를 올려서 설명해 달라고 하고, 이를 그대로 다른 AI 이미지 생성 사이트를 통해 입력하면 비슷한 느낌의 이미지를 얻을 수 있답니다. 인공지능 분야에서 가장 직관적인 이미지 생성에 대해서 간단히 정리해 보았답니다. 직접 위의 사이트에 한번씩 들러서 확인해 보세요.

챗GPT의 비디오 AI 소라(Sora) 공개: 1분 길이 영상도 거뜬

챗GPT를 만든 OpenAI에서 비디오 AI 서비스인 Sora를 공개하였습니다. Text-to-Video, 텍스트를 입력하면 비디오를 만들어주는 방식의 서비스이며, 현재는 일부 크리에이터들에게 공개되었습니다. 최대 1분 정도의 영상을 단순한 프롬프트만으로도 만들 수 있으며, 전 세계 많은 사람들의 관심이 폭발하고 있답니다. 우선 아래 공식 영상부터 먼저 보시지요. AI 대전환의 시대가 점점 더 가속화되는 느낌이랍니다.

Introducing Sora — OpenAI’s text-to-video model

비디오 AI 소라(Sora) 소개

소라(Sora)는 텍스트를 통해 사실적이고 상상력이 풍부한 장면을 만들 수 있는 AI 모델입니다. 이를 위해 OpenAI는 사람들이 실제 상호작용이 필요한 문제를 해결하는 데 도움이 되는 모델을 학습시키는 것을 목표로 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있도록 AI를 교육하였다고 합니다.

비디오 AI, 소라

모델은 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있습니다. 이 모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에 이러한 사물이 어떻게 존재하는지도 이해합니다.

이 모델은 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 감정을 표현하는 매력적인 캐릭터를 생성할 수 있습니다. 또한 소라(Sora)는 하나의 동영상 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 생성할 수 있습니다.

다만, OpenAI는 현재 모델에 약점이 있다고 합니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며, 원인과 결과의 특정 사례를 이해하지 못할 수도 있습니다. 예를 들어, 사람이 쿠키를 한 입 베어 물었지만 나중에 쿠키에 물린 자국이 없을 수 있다고 하네요.

이 모델은 왼쪽과 오른쪽을 혼동하는 등 프롬프트의 공간적 세부 사항을 혼동할 수 있으며 특정 카메라 궤적을 따라가는 것과 같이 시간에 따라 발생하는 이벤트를 정확하게 설명하는 데 어려움을 겪을 수 있다고 합니다.

비디오 AI 소라(Sora) 연구 기법

OpenAI가 밝힌 연구 기법의 상세 소개는 다음과 같습니다. 소라(Sora)는 확산 모델로, 정적 노이즈처럼 보이는 동영상으로 시작하여 여러 단계에 걸쳐 노이즈를 제거하여 점차적으로 변환하는 방식으로 동영상을 생성합니다.

소라(Sora)는 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있습니다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공함으로써 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다고 합니다.

GPT 모델과 마찬가지로 Sora는 트랜스포머 아키텍처를 사용하여 뛰어난 확장 성능을 구현합니다. 동영상과 이미지를 패치라고 하는 작은 데이터 단위의 모음으로 표현하며, 각 패치는 GPT의 토큰과 유사합니다. 데이터를 표현하는 방식을 통합함으로써 다양한 길이, 해상도, 종횡비에 걸쳐 이전보다 더 광범위한 시각 데이터에 대해 확산 변환기를 훈련할 수 있습니다.

소라(Sora)는 DALL-E와 GPT 모델에 대한 과거 연구를 기반으로 합니다. 이 모델은 시각적 학습 데이터에 대해 설명력이 높은 캡션을 생성하는 DALL-E 3의 리캡션 기술을 사용합니다. 그 결과 모델은 생성된 동영상에서 사용자의 텍스트 지시를 보다 충실히 따를 수 있습니다.

이 모델은 텍스트 설명만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 정지 이미지를 가져와서 동영상을 생성할 수 있으며, 이미지의 내용을 정확하고 세세한 부분까지 애니메이션으로 표현할 수 있습니다. 또한 모델은 기존 비디오를 가져와서 확장하거나 누락된 부분을 채울 수도 있습니다.

Sora는 사용자가 입력한 텍스트 설명을 바탕으로 관련된 비디오 클립을 생성합니다. 이는 기존의 텍스트나 이미지 생성 AI와 유사한 방식으로 작동하지만, 동적인 비디오 콘텐츠를 생성한다는 점에서 큰 차이를 보입니다.

이 AI는 다양한 장르와 스타일의 비디오를 생성할 수 있는 능력을 갖추고 있어, 교육용 콘텐츠부터 엔터테인먼트, 광고까지 폭넓은 활용이 가능합니다. 사용자의 요구와 상황에 맞는 맞춤형 비디오 제작이 가능해져, 콘텐츠 제작자들에게 큰 도움이 될 것으로 기대됩니다.

Sora는 최대 1분 길이의 고품질 비디오를 생성할 수 있으며, 이는 기존의 짧은 GIF나 애니메이션 클립을 넘어서는 진보입니다. 이를 통해 보다 복잡하고 내용이 풍부한 비디오 스토리텔링이 가능해집니다.

Sora는 다양한 분야에서 그 활용 가능성을 보여줍니다. 교육 분야에서 Sora는 복잡한 개념이나 이론을 쉽게 설명하는 비디오 콘텐츠 제작에 활용될 수 있습니다. 학생들의 이해를 돕는 생동감 있는 시각 자료를 제공함으로써 교육의 질을 높일 수 있습니다.

마케팅과 광고 분야에서는 Sora를 활용하여 창의적이고 매력적인 광고 비디오를 신속하게 제작할 수 있습니다. 이는 브랜드의 메시지를 효과적으로 전달하고, 타겟 오디언스의 주목을 끌 수 있는 방법이 될 수 있습니다.

엔터테인먼트 분야에서 Sora는 새로운 형태의 스토리텔링과 창작물을 탄생시킬 수 있습니다. 사용자가 상상하는 다양한 시나리오를 비디오로 구현함으로써, 새로운 장르의 콘텐츠 개발이 가능해집니다.

챗GPT의 비디오 AI ‘소라(Sora)’의 공개는 디지털 콘텐츠 제작 분야에 새로운 가능성을 제시합니다. 텍스트 입력만으로 고품질의 비디오를 생성할 수 있는 이 기술은 교육, 마케팅, 엔터테인먼트 등 다양한 분야에서 창의적인 활용이 기대됩니다. ‘Sora’는 디지털 콘텐츠 제작의 미래를 재정의하며, AI 기술의 발전이 우리의 일상과 산업에 어떤 혁신적인 변화를 가져올 수 있는지 보여주고 있습니다.