AI 이미지 사이트 베스트 7, 미드저니부터 DALL-E까지

챗GPT가 세상에 소개된 지 1년 조금 지났습니다만 그 사이 생성형 AI 기술은 실제 기술을 다루는 사람들에게도 그 속도를 쫓아갈 수 없을 정도로 빠르게 변화하였습니다. 챗봇도 물론 혁신적이지만 많은 사람들이 AI 이미지 서비스들을 보면서 놀라움을 금치 못하고 있답니다. 물론 하나의 글을 가지고 AI 이미지 분야를 모두 이해한다는 것은 현실적으로 어려우나 아주 기초적인 내용으로 가볍게 읽어보시면 좋겠습니다. 디지털 트랜스포메이션의 하나인 AI 전환이 현대를 살아가는 모든 사람들에게 해당되며, 이 글을 통해 그 개념을 조금이나마 공감하면 좋겠습니다.

인공지능 시대의 도래

OpenAI의 챗GPT를 시작으로, 마이크로소프 코파일럿, 구글의 제미나이, 이외에 다양한 인공지능 서비스들이 홍수처럼 쏟아지고 있습니다. 인공지능이 당장의 우리의 일자리를 빼앗지는 않겠지만 앞으로 사무직군의 경우에는 인공지능으로 인해 여러 일자리를 위협 받는다는 뉴스는 이미 여러 곳에서 소개되었습니다. 저 또한 이러한 흐름에는 동의하고, 실제로 반영될 것입니다.

그러나 이 맥락을 조금만 더 깊게 곱씹어보면 인공지능을 잘 활용하는 사람들이 그렇지 못한 사람들을 대체할 가능성이 높다고 생각합니다. 앞으로 직장 생활을 잘 한다는 것은 지금의 컴퓨터와 다양한 오피스 프로그램을 다루는 것처럼 인공지능을 잘 다뤄야 한다는 것을 의미하는 날이 멀지 않았습니다. 너무나 급격하게 변화지만 하나씩 실제 업무에 적용해보고, 고민해보면 좋겠습니다.

AI 이미지 사례

인공지능은 이미 우리가 상상하는 능력을 뛰어넘고 있습니다. 다음의 인공지능이 그린 이미지들을 보시지요. 실제와 구분할 수 없을 정도의 AI 이미지 서비스들도 이미 많은 사람들이 사용하고 있습니다. 대표적으로 미드저니나 OpenAI의 DALL-E, 마이크로소프트의 빙 이미지 크리에이터까지 쉽게 활용할 수 있답니다. 앞서 인공지능을 사용하는 사람들에 의해 대체될 수 있다는 분야 중 사진과 그래픽을 만드는 분야도 예외는 아닐 것 같습니다. 다만, 제대로 된 AI 이미지를 만드려면 한두번의 프롬프트로는 가능하지 않고, 나름의 전문적인 지식과 경험이 필요하답니다.

AI 이미지

위의 이미지를 보면 어떤가요? AI 이미지인지 실제 촬용한 사진인지 쉽게 구분이 되나요? 다음 이미지도 한번 보시지요. 역사속의 인물들이 셀카 찍는 장면을 연출한 AI 이미지입니다. 정말 놀랍지 않나요?

AI 이미지

다음의 AI 이미지도 한번 보시지요. 만일 다음과 같은 이미지를 실제 촬영한다거나 아니면 컴퓨터 그래픽으로 만든다고 하면 아마도 상당한 고가 장비를 사용하거나 아니면 오랜 시간 컴퓨터 작업이 필요한 품질의 이미지들입니다.

AI 이미지

AI 이미지 생성 사이트

최근 많은 사람들의 관심을 받고 있는 인공지능 이미지를 만들 수 있는 생성 사이트들입니다.

1) 미드저니

인공지능 이미지 생성 사이트 중에 가장 고품질의 이미지를 만들 수 있는 곳입니다만 이제는 무료로 사용할 수 없다는 단점이 있습니다. 단, 인공지능 이미지의 대표선수이니 꼭 살펴보세요.

미드저니

2) DALL-E (OpenAI)

챗GPT를 사용하는 분들이라면 DALL-E도 한번 이상은 들어보셨을 것입니다. 이전에는 별도의 서비스로 있었지만 이제는 GPT4를 활용할 때 기본으로 사용할 수 있답니다. 프롬프트에 이미지를 만들어 달라고하면 내부적으로 DALL-E 모델이 동작하면서 이미지를 만들어 줍니다.

DALL-E 이미지

3) 마이크로소프트 Copilot GPT – Designer

빙 챗 이미지 크리에이터라고 불리는 마이크로소프트의 코파일럿의 기능의 하나입니다. 마찬가지로 이미지를 쉽게 만들어 줍니다.

마이크로소프트 빙 챗

4) Playground

현재는 하루에 500개 이미지를 만들 수 있고, 상용으로도 사용할 수 있다고 합니다. 유료 모델이 있으니 이는 사이트를 통해서 확인해 보세요.

Playground

5) Canva

Canva의 AI 이미지 생성 도구는 로고, 포스터, 소셜 미디어 콘텐츠 등 다양한 디자인 작업에 활용될 수 있습니다. 사용자 친화적인 인터페이스와 다양한 템플릿이 특징입니다. 로고 작업이나 여러 템플릿을 바탕으로 다양한 이미지를 만들어볼 수 있답니다.

6) Adobe Firefly

포토샵으로 유명한 어도비 또한 인공지능 이미지 분야에서 빠질 수 없답니다. 실제 그래픽 디자이너들이 어떻게 인공지능을 활용하여 작업할 수 있을지 다양한 영감과 손쉽게 활용할 수 있도록 서비스를 제공하고 있답니다. 어도비의 Firefly는 전문 그래픽 디자이너들을 위한 강력한 AI 이미지 생성 도구입니다. 포토샵과의 연동을 통해 더욱 향상된 작업 효율을 경험할 수 있습니다. 앞서 다양한 서비스들처럼 프롬프트를 활용해서 이미지를 생성하는 것부터, 이미지의 부족한 부분을 AI로 채우기, 배경 제거하기, 스케치를 가지고 이미지 만들기 등 정말 많은 사례들이 있으니 꼭 방문하셔서 살펴보시면 좋겠습니다.

Adobe Firefly

7) freeflo: 생성형 AI를 만드는 방법이 궁금할 때

다양한 AI 이미지 서비스들을 통해서 만든 이미지를 볼 때마다 어떻게 만들었을지 궁금할텐데 이런 이미지들을 공유하고, 프롬프트를 확인할 수 있는 사이트가 있답니다. 바로 freeflo 서비스로 사이트를 통해서 원하는 이미지 분위기를 검색해서 프롬프트를 확인하면 이를 다양한 서비스에서 직접 입력하여 결과를 확인 가능합니다.

freeflo

이외에도 대표적인 이미지 생성 서비스로 스테이블 디퓨전을 비롯하여 많이 있습니다. 그러나 어떤 서비스든 자신의 목적에 맞도록 서비스 하나를 선택해서 자주 사용하는 것이 이 인공지능, 특히 생성형 인공지능 분야를 이해하는데 도움이 될 것입니다. 마지막으로 생성형 AI의 프롬프트를 만드는 팁 하나 알려 드립니다. 잠시 전에 보셨던 freeflo 같은 곳에서 찾아볼 수도 있지만 이미지에 대해서 설명해주는 AI 서비스를 활용하는 것도 좋은 방법입니다.

예를 들어, 챗GPT에 특정 이미지를 올려서 설명해 달라고 하고, 이를 그대로 다른 AI 이미지 생성 사이트를 통해 입력하면 비슷한 느낌의 이미지를 얻을 수 있답니다. 인공지능 분야에서 가장 직관적인 이미지 생성에 대해서 간단히 정리해 보았답니다. 직접 위의 사이트에 한번씩 들러서 확인해 보세요.

챗GPT의 비디오 AI 소라(Sora) 공개: 1분 길이 영상도 거뜬

챗GPT를 만든 OpenAI에서 비디오 AI 서비스인 Sora를 공개하였습니다. Text-to-Video, 텍스트를 입력하면 비디오를 만들어주는 방식의 서비스이며, 현재는 일부 크리에이터들에게 공개되었습니다. 최대 1분 정도의 영상을 단순한 프롬프트만으로도 만들 수 있으며, 전 세계 많은 사람들의 관심이 폭발하고 있답니다. 우선 아래 공식 영상부터 먼저 보시지요. AI 대전환의 시대가 점점 더 가속화되는 느낌이랍니다.

Introducing Sora — OpenAI’s text-to-video model

비디오 AI 소라(Sora) 소개

소라(Sora)는 텍스트를 통해 사실적이고 상상력이 풍부한 장면을 만들 수 있는 AI 모델입니다. 이를 위해 OpenAI는 사람들이 실제 상호작용이 필요한 문제를 해결하는 데 도움이 되는 모델을 학습시키는 것을 목표로 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있도록 AI를 교육하였다고 합니다.

비디오 AI, 소라

모델은 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있습니다. 이 모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에 이러한 사물이 어떻게 존재하는지도 이해합니다.

이 모델은 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 감정을 표현하는 매력적인 캐릭터를 생성할 수 있습니다. 또한 소라(Sora)는 하나의 동영상 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 생성할 수 있습니다.

다만, OpenAI는 현재 모델에 약점이 있다고 합니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며, 원인과 결과의 특정 사례를 이해하지 못할 수도 있습니다. 예를 들어, 사람이 쿠키를 한 입 베어 물었지만 나중에 쿠키에 물린 자국이 없을 수 있다고 하네요.

이 모델은 왼쪽과 오른쪽을 혼동하는 등 프롬프트의 공간적 세부 사항을 혼동할 수 있으며 특정 카메라 궤적을 따라가는 것과 같이 시간에 따라 발생하는 이벤트를 정확하게 설명하는 데 어려움을 겪을 수 있다고 합니다.

비디오 AI 소라(Sora) 연구 기법

OpenAI가 밝힌 연구 기법의 상세 소개는 다음과 같습니다. 소라(Sora)는 확산 모델로, 정적 노이즈처럼 보이는 동영상으로 시작하여 여러 단계에 걸쳐 노이즈를 제거하여 점차적으로 변환하는 방식으로 동영상을 생성합니다.

소라(Sora)는 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있습니다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공함으로써 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다고 합니다.

GPT 모델과 마찬가지로 Sora는 트랜스포머 아키텍처를 사용하여 뛰어난 확장 성능을 구현합니다. 동영상과 이미지를 패치라고 하는 작은 데이터 단위의 모음으로 표현하며, 각 패치는 GPT의 토큰과 유사합니다. 데이터를 표현하는 방식을 통합함으로써 다양한 길이, 해상도, 종횡비에 걸쳐 이전보다 더 광범위한 시각 데이터에 대해 확산 변환기를 훈련할 수 있습니다.

소라(Sora)는 DALL-E와 GPT 모델에 대한 과거 연구를 기반으로 합니다. 이 모델은 시각적 학습 데이터에 대해 설명력이 높은 캡션을 생성하는 DALL-E 3의 리캡션 기술을 사용합니다. 그 결과 모델은 생성된 동영상에서 사용자의 텍스트 지시를 보다 충실히 따를 수 있습니다.

이 모델은 텍스트 설명만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 정지 이미지를 가져와서 동영상을 생성할 수 있으며, 이미지의 내용을 정확하고 세세한 부분까지 애니메이션으로 표현할 수 있습니다. 또한 모델은 기존 비디오를 가져와서 확장하거나 누락된 부분을 채울 수도 있습니다.

Sora는 사용자가 입력한 텍스트 설명을 바탕으로 관련된 비디오 클립을 생성합니다. 이는 기존의 텍스트나 이미지 생성 AI와 유사한 방식으로 작동하지만, 동적인 비디오 콘텐츠를 생성한다는 점에서 큰 차이를 보입니다.

이 AI는 다양한 장르와 스타일의 비디오를 생성할 수 있는 능력을 갖추고 있어, 교육용 콘텐츠부터 엔터테인먼트, 광고까지 폭넓은 활용이 가능합니다. 사용자의 요구와 상황에 맞는 맞춤형 비디오 제작이 가능해져, 콘텐츠 제작자들에게 큰 도움이 될 것으로 기대됩니다.

Sora는 최대 1분 길이의 고품질 비디오를 생성할 수 있으며, 이는 기존의 짧은 GIF나 애니메이션 클립을 넘어서는 진보입니다. 이를 통해 보다 복잡하고 내용이 풍부한 비디오 스토리텔링이 가능해집니다.

Sora는 다양한 분야에서 그 활용 가능성을 보여줍니다. 교육 분야에서 Sora는 복잡한 개념이나 이론을 쉽게 설명하는 비디오 콘텐츠 제작에 활용될 수 있습니다. 학생들의 이해를 돕는 생동감 있는 시각 자료를 제공함으로써 교육의 질을 높일 수 있습니다.

마케팅과 광고 분야에서는 Sora를 활용하여 창의적이고 매력적인 광고 비디오를 신속하게 제작할 수 있습니다. 이는 브랜드의 메시지를 효과적으로 전달하고, 타겟 오디언스의 주목을 끌 수 있는 방법이 될 수 있습니다.

엔터테인먼트 분야에서 Sora는 새로운 형태의 스토리텔링과 창작물을 탄생시킬 수 있습니다. 사용자가 상상하는 다양한 시나리오를 비디오로 구현함으로써, 새로운 장르의 콘텐츠 개발이 가능해집니다.

챗GPT의 비디오 AI ‘소라(Sora)’의 공개는 디지털 콘텐츠 제작 분야에 새로운 가능성을 제시합니다. 텍스트 입력만으로 고품질의 비디오를 생성할 수 있는 이 기술은 교육, 마케팅, 엔터테인먼트 등 다양한 분야에서 창의적인 활용이 기대됩니다. ‘Sora’는 디지털 콘텐츠 제작의 미래를 재정의하며, AI 기술의 발전이 우리의 일상과 산업에 어떤 혁신적인 변화를 가져올 수 있는지 보여주고 있습니다.

구글 제미나이(Gemini)로 ChatGPT 반격을 노리다

구글의 바드(Bard)가 제미나이(Gemini)로 새롭게 태어났습니다. 구글은 지난 12월 구글 Gemini 발표에서 소개하였던 구글의 최대 규모 AI 모델인 Gemini Ultra를 탑재한 제미나이 어드밴스드(Gemini Advanced)를 출시하였습니다.

구글 제미나이(Gemini)로 ChatGPT 반격을 노리다
구글 제미나이(Gemini)로 ChatGPT 반격을 노리다

작년 5월 구글 바드(Bard)는 한글 버전이 출시되면서 챗GPT(ChatGPT)의 강력한 경쟁자가 등장하는 것 아닌가라는 기대를 했지만 실제 기대만큼의 유명세를 만들지는 못했는데 드디어 제미나이로 반격을 시작하는 모양새입니다. 이를 위해 과감히 바드라는 브랜드를 버리고 제미나이로 탄생을 선택한 것 아닌가라는 생각이 듭니다.

구글 제미나이 어드밴스드 출시와 유료 요금제

제미나이 울트라를 탑재한 제미나이 어드밴스드는 150개 이상의 국가 및 지역에서 서비스를 시작하였습니다. 다만 아직까지는 영어로만 사용할 수 있으며, 향후 한국어를 포함한 다양한 언어로 확대될 예정입니다.

다만, 제미나이 어드밴스드는 ChatGPT Plus처럼 유료 과금 모델을 채택하였으며, 구글 원 AI 프리미엄(Google One AI Premium) 요금제의 일부로 월 29,000원에 이용할 수 있답니다. (연간 요금제 별도 제공) 그리고 현재는 해당 요금제 가입 시 2개월 동안 무료로 사용할 수 있는 프로모션도 같이 진행하고 있답니다. 29,000원의 유료 모델을 가입하게 되면 구글 원(Google One) 스토리지도 2TB 사용의 혜택도 누를 수 있답니다.

스크린샷 2024 02 09 오전 11.34.46

아울러 구글 원 AI 프리미엄 요금제 가입자는 조만간 지메일, 구글 닥스 등에서 제미나이를 사용할 수 있게 된다고 합니다.

제미나이 앱 출시로 사용자 접근성 확대

구글은 사용자들이 손쉽게 스마트폰을 통해 제미나이와 제미나이 어드밴스드를 쉽게 경험할 수 있도록 하기 위해 안드로이드용 제미나이 앱과 iOS 환경의 구글 앱 업데이트도 발표했습니다. 안드로이드 기기에서는 앱을 다운로드한 후 홈 버튼 또는 전원 버튼을 길게 눌러 제미나이를 활성화할 수 있으며, 기존 구글 어시스턴트의 유용한 기능이 함께 결합돼 보다 다양한 작업도 수행할 수 있습니다.

챗GPT(ChatGPT)의 경우에도 앱을 출시하면서 사용자들의 접근성을 확대하였는데 구글 또한 동일한 접근 전략을 피는 것으로 해석할 수 있는 대목입니다. 다만, 제미나이의 경우에는 무료 앱에서 사진 등의 업로드를 허용하고 있어 제미나이의 멀티모달 기능을 스마트폰에서 쉽게 체험해볼 수 있을 것으로 기대됩니다.

제미나이 안드로이드 앱
제미나이 안드로이드 앱

iOS 기기의 경우 구글 어플리케이션을 통해 제미나이를 바로 이용할 수 있습니다. 우선 오늘부터 미국에서 영어로 이용 가능하며, 다음 주부터는 한국어와 일본어로도 이용 가능합니다. 이후 더 많은 지역에서 다양한 언어로 지원될 예정이라고 합니다.