OpenAI, 다시 오픈소스로 돌아오다: GPT-OSS-120B와 GPT-OSS-20B가 의미하는 것

OpenAI의 이름 값처럼 오픈소스 생태계로의 복귀를 선언하며, GPT-OSS-120B와 GPT-OSS-20B를 공개했습니다. 이번에 공개된 GPT-OSS-120B와 GPT-OSS-20B는 각각 1,200억 개, 200억 개의 파라미터를 갖춘 대형 언어모델로, 누구나 로컬 환경에서 실행하고 자유롭게 커스터마이징할 수 있도록 설계되었습니다.

오픈소스로 돌아간 배경: 왜 지금인가?

OpenAI의 이번 오픈소스 발표는 단순한 기술 공개가 아닙니다. GPT-4o, ChatGPT 등 자체 제품군으로 연간 130억 달러 이상의 수익을 창출하고 있는 OpenAI가 굳이 수익모델이 불명확한 오픈소스 모델을 이 시점에서 다시 공개했다는 점은 전략적인 시사점을 지닙니다.

그 배경에는 세 가지 흐름이 있습니다. 먼저, 중국을 중심으로 글로벌 오픈소스 AI 생태계가 빠르게 성장하고 있습니다. DeepSeek, Qwen, Kimi, GLM 등 다양한 고성능 오픈모델이 각광받으며 모델 경쟁력의 균형이 흔들리고 있습니다.

둘째, 규제가 까다롭고 민감한 데이터를 다루는 분야—예컨대 의료, 금융, 법률 등—에서는 클라우드에 데이터를 업로드하지 않고도 내부망에서 실행 가능한 AI 모델에 대한 수요가 빠르게 늘어나고 있습니다.

셋째, 2019년 GPT-2 이후 상용화에 집중해온 OpenAI는 투명성 부족에 대한 커뮤니티의 비판과 법적 압박을 받아왔습니다. 이에 따라, OpenAI는 창립 초기 취지로 돌아가 오픈소스 정신을 다시 살리려는 태도를 보이고 있습니다.

GPT-OSS-120B와 GPT-OSS-20B의 기술 사양

이번에 공개된 두 모델은 기술과 접근성 면에서 모두 커뮤니티 친화적인 설계를 갖추고 있습니다. GPT-OSS-120B는 대형 모델임에도 불구하고 단 한 개의 NVIDIA H100 GPU에서 실행 가능한 수준으로 최적화되어 있으며, GPT-OSS-20B는 개인용 노트북에서도 구동할 수 있을 정도로 경량화되어 있습니다.

두 모델 모두 텍스트 기반 언어모델로, 음성이나 이미지 등 멀티모달 기능은 포함하지 않습니다. 다만 입력 길이는 128,000 토큰까지 지원되어, 약 300페이지에 달하는 문서를 한 번에 처리할 수 있습니다. 여기에 Apache 2.0 라이선스를 적용해, 상업적 이용이나 재배포에도 제약이 없습니다. 클라우드 기반이 아니라 로컬에서 실행 가능한 구조라는 점도 보안이 중요한 조직에는 큰 혜택입니다.

기업 입장에서는 단순히 무상 모델을 사용하는 것 이상의 전략적 선택지를 확보할 수 있게 된 셈입니다.

GPT-OSS

고성능 벤치마크에서의 성과

이번 모델이 오픈소스라는 점만 주목해서는 안 됩니다. 성능 면에서도 경쟁력이 높습니다. OpenAI의 자체 벤치마크에 따르면 GPT-OSS-120B는 주요 인공지능 테스트에서 현재 사용 중인 고사양 상용 모델들과 비슷하거나 그 이상 수준의 성과를 기록했습니다.

예를 들어 수학 문제 풀이에서는 AIME 2024/2025 기준으로 높은 정확도를 나타냈고, 일반 지식과 문제 해결 능력을 평가하는 MMLU 및 HLE에서도 우수한 성적을 보였습니다. 체계적 사고가 필요한 TauBench, 의료 분야 정확성을 평가하는 HealthBench에서도 상위권에 올랐습니다.

특히 GPT-OSS-20B는 크기 측면에서는 경량 모델임에도 불구하고 OpenAI의 기존 상용 모델인 o3-mini보다 뛰어난 성능을 보인 것으로 확인되었습니다. GPT-3 계열 성능에 근접했다는 점도 인상적입니다.

GPT-OSS의 구조와 개발자 기능

GPT-OSS 모델은 Transformer 기반의 Mixture-of-Experts(MoE) 구조를 채택하고 있습니다. 이 구조는 입력되는 토큰마다 일부 전문가 모델만을 활성화하는 방식으로, 처리 속도와 효율은 높이면서 성능 저하는 방지하는 것이 특징입니다.

120B 모델의 경우, 토큰당 약 5.1억 개 파라미터를, 20B 모델의 경우 3.6억 개 파라미터를 활성화합니다. RoPE 기반 임베딩 구조를 채택했고, 오픈 토크나이저(o200k_harmony)도 함께 제공됩니다. 이러한 구조는 체계적 사고 추론(Chain of Thought), 외부 도구 호출, 함수 실행 기반 작업에 적합하게 설계되었습니다.

또한 Responses API와도 호환되어, 웹 검색, 로컬 파일 조회, 커맨드라인 호출까지 하나의 입력 시퀀스로 통합할 수 있는 기능도 제공합니다. RAG나 복잡한 응답 기반 시스템 구성에 적합합니다.

라이선스 비교: OpenAI vs Meta vs 중국 모델

GPT-OSS 시리즈의 Apache 2.0 라이선스는 상업적 이용에 있어 사실상 거의 제약이 없는 조건입니다. 이는 OpenAI가 향후 기업 고객들에게 모델 도입 장벽을 낮추겠다는 의지를 명확히 보여주는 요소입니다.

이를 경쟁사 모델과 비교해보면 그 차이가 분명해집니다. Meta의 Llama 3.1은 Community License 하에 제한적 상업 사용만 허용되며, 월간 사용자 수 7억 명 이상 기업에는 제한이 가해집니다. 구글의 Gemma는 비영리 중심 사용에 더 적절하고, Microsoft의 Phi 시리즈는 MIT 라이선스를 채택했지만 적용 사례가 비교적 제한적입니다.

중국의 Qwen이나 GLM은 Apache 2.0을 택하고 있으며, 이번 OpenAI의 행보는 이들과 기술 및 정책 양면에서 직접적인 경쟁을 펼치겠다는 신호이기도 합니다.

미래 전략: 기업 고객을 위한 Full-stack AI 접근

OpenAI는 이번 오픈소스 모델 출시를 단일 이벤트가 아닌, 전반적인 AI 접근 전략의 일환으로 보고 있습니다. 기존의 ChatGPT, Sora(비디오 생성 모델), GPT API, GPT-4o 기반의 오디오 및 이미지 AI에 이어, GPT-OSS는 오픈소스를 통한 생태계 확장 전략의 핵심 중 하나입니다.

뿐만 아니라 OpenAI는 컨설팅 조직 ‘AI Forward Deployment’를 통해 기업 현장에 직접 AI 모델을 도입하고 커스터마이징을 지원하는 전담팀도 운영 중입니다. 이는 Palantir와 유사한 하이엔드 엔터프라이즈 지원 전략으로, 단순한 기술 공급을 넘어 서비스형 AI 컨설팅 제공으로까지 손을 뻗는 행보로 해석할 수 있습니다.

마무리: GPT-OSS가 제공하는 새로운 방향성

AI 모델 시장은 이제 단순히 ‘파라미터 수’ 경쟁을 넘어서고 있습니다. 기업들은 점점 더 자사의 업무 환경, 데이터 보안, 규제 요구 등 다양한 요건에 맞춰 인공지능 도입을 고민하고 있습니다.

이런 점에서 GPT-OSS 시리즈는 현실적인 오픈소스 대안으로 부각됩니다. 충분한 성능을 갖췄으며, 검증된 보안성, 자유로운 라이선스를 바탕으로 실제 기업 도입이 가능한 종합 AI 솔루션입니다.

다가오는 AI 시대에, 오픈소스는 단순히 ‘무료’라는 의미에 그치지 않습니다. 그것은 기업에게 자율성과 통제, 그리고 맞춤형 전략을 제공하는 새로운 플랫폼입니다. 기업이 AI를 직접 주도할 수 있는 시대. 그것이 OpenAI가 이번 GPT-OSS를 통해 제시하고 있는 미래입니다.

GPT-OSS
AX 100배의 법칙
AX 100배의 법칙
– 나와 조직의 능력을 100배 높이는 AI 경영의 실제

도서 구매

함께 읽으면 좋은 글:

디지털 트랜스포메이션: 조직의 습관을 바꾸는 일, 도서 구매

. .

ChatGPT의 비약적 성장과 GPT-5의 등장: AI 시대의 대전환이 시작됐다

OpenAI가 개발한 대화형 인공지능 서비스인 ChatGPT가 주간 활성 사용자 7억 명을 돌파하며, AI 산업의 리더로의 지위를 확고히 하고 있습니다. 이는 불과 1년 전과 비교해 4배 이상 증가한 수치로, 팬데믹 당시 Zoom의 폭발적인 확산이나 소셜 미디어 초기 성장세를 떠올리게 할 정도로 가파른 속도입니다.

ChatGPT, 전 세계 주간 사용자 7억 명 돌파

2025년 8월 기준, ChatGPT의 주간 활성 사용자는 7억 명을 넘어섰습니다. 이는 불과 4개월 전인 2025년 3월의 5억 명에서 40% 이상 늘어난 수치로, 인공지능 서비스로서는 사상 유례없는 성장세입니다.

2024년 중반까지만 해도 ChatGPT는 주로 개발자나 특정 기업 사용자들이 사용하는 도구에 불과했습니다. 하지만 2025년 들어 일반 사용자와 기업 전반으로 활용이 넓어지며 본격적인 대중화 단계에 접어들었습니다.

image 15

사용자 증가의 원인: 다양성과 효용성

성장의 배경에는 단순한 유행이 아닌 실효성이 있었습니다. ChatGPT는 더 이상 단순한 챗봇이 아닙니다. 정보를 요약하거나 마케팅 아이디어를 발굴하고, 코드를 점검하거나 이메일 초안을 작성하며, 고객지원 업무를 자동화하는 등 실제 업무 전반에 걸쳐 활용되고 있습니다.

예를 들어, 한 미국 스타트업은 ChatGPT를 활용해 마케팅 콘텐츠 초안을 작성한 결과, 콘텐츠 제작 속도가 기존 대비 3배 빨라졌다고 밝혔습니다. 일본의 교육 플랫폼 역시 ChatGPT를 도입해 수험생 맞춤 학습 콘텐츠를 자동 생성하고, 튜터 비용의 60%를 절감하는 성과를 올렸습니다.

이처럼 ‘실제로 도움이 되는 기술’이라는 인식이 확산되면서 사용자 증가로 이어지고 있는 것입니다.

GPT-5의 출시: 진정한 AI 통합 모델의 탄생

ChatGPT의 성장과 동시에 큰 기대를 모으고 있는 것이 차세대 모델인 GPT-5입니다. GPT-5는 단순한 성능 개선을 넘어, ‘추론(reasoning)’ 능력까지 대폭 강화해 완전히 새로운 방식의 인공지능으로 진화하고 있습니다.

특히 GPT-5는 OpenAI의 고급 추론 모델인 O3 기술을 통합해 하나의 일관된 AI 시스템으로 작동합니다. 덕분에 사용자가 질문 형태에 따라 모델을 고를 필요 없이 언제든지 높은 품질의 답변을 제공받을 수 있습니다.

GPT-5는 다양한 버전(GPT-5 Mini와 Nano 등)으로도 출시될 예정이며, API 기반으로 기업 맞춤형 서비스 구성도 가능해 범용성과 전문성을 동시에 확보했다는 평가를 받고 있습니다.

기업 사용자 수 500만 돌파: 비즈니스 중심의 AI 확산

ChatGPT는 일반 사용자를 넘어 기업 시장에서도 빠르게 확산되고 있습니다. 2025년 8월 기준, OpenAI의 기업 고객 수는 500만 명을 넘어서면서, 두 달 전의 300만 명에서 약 66% 성장했습니다.

이제는 중소기업뿐만 아니라 전 세계 대기업들도 ChatGPT를 마케팅, 고객 대응, 내부 업무 자동화 등 핵심 업무 도구로 도입하고 있습니다. 미국의 유통 대기업 월마트는 물류창고 현장에서 AI 기반 자동 질의응답 시스템을 도입해 고객 대응 시간을 평균 35% 단축했습니다.

AI 산업의 본격 수익화: 투자와 수익 모두 급증

이러한 이용 확산은 곧바로 수익으로 이어지고 있습니다. OpenAI는 현재 연간 수익이 130억 달러(약 17조 원)를 넘어섰으며, 올해 말까지 200억 달러 달성이 유력하다는 전망도 나오고 있습니다. 이는 AI가 ‘미래 기술’에서 ‘실제 비즈니스 모델’로 전환되고 있다는 증거입니다.

OpenAI는 향후 수요 증가에 대비해 오라클과 연간 약 300억 달러 규모의 데이터센터 인프라 계약을 체결했으며, 인공지능 클라우드 스타트업 CoreWeave와도 약 119억 달러 규모의 계약을 맺었습니다. 이러한 전략적 투자는 기술 성능 향상뿐 아니라 안정적인 서비스 운영을 위한 기반 확보 측면에서도 의미가 큽니다.

GPT-5와 AGI에 대한 기대감

GPT-5의 등장이 기술 이상의 의미를 갖는 이유는, OpenAI의 궁극적인 목표인 AGI(Artificial General Intelligence) 실현에 한 걸음 더 다가간 모델이기 때문입니다. AGI는 사람과 동등하거나 그 이상의 지능을 갖춘 범용 인공지능을 뜻합니다.

전문가들은 GPT-5가 AGI 수준의 초입에 다가갈 수 있을 것으로 기대하고 있습니다. 특히 GPT가 AGI 수준에 도달할 경우, Microsoft와의 전략적 파트너십 구조에도 변동이 있을 수 있다는 분석이 나옵니다. 현재 계약상 AGI가 달성되면 Microsoft가 일정 권리를 양보해야 하기 때문입니다.

결국 GPT-5는 단순한 기술 향상을 넘어, 글로벌 기술정책, 산업 경쟁 구도, 윤리 기준까지 변화시키는 촉매제가 될 수 있습니다.

ChatGPT의 새로운 방향: 인간 중심 AI로의 진화

OpenAI는 최근 인간 중심의 기능 강화를 강화하고 있습니다. 이제 단순히 성능 좋은 AI가 아니라, 사용자의 정신적‧사회적 웰빙을 고려한 AI로 진화하고 있는 것입니다.

실제로 최근 업데이트에서는 집중 루틴을 유도하는 ‘휴식 리마인더’ 기능, 스트레스 상황에서 활용할 수 있는 대응 가이드, 정신건강 전문가의 피드백을 반영한 대화 알고리즘 등이 추가됐습니다.

마무리: 7억 명이 선택한 기술, 그 다음 단계는 GPT-5입니다

ChatGPT의 7억 명 사용자 달성은 단순한 수치가 아니라, 기술에 대한 신뢰와 실제 효용성을 입증하는 상징적인 이정표입니다. 여기에 GPT-5라는 다음 단계가 더해지면서, AI는 이제 선택이 아닌 전략의 중심이 되고 있습니다.

기업이든 개인이든 지금 이 순간에도 AI는 이미 우리 곁에 있습니다. 늦기 전에, 여러분의 사업과 일상에 AI를 한 번 접목해보시길 권해드립니다. 그 작은 변화가, 앞으로의 경쟁력에 결정적인 차이를 만들어낼 것입니다.

GPT-5
AX 100배의 법칙
AX 100배의 법칙
– 나와 조직의 능력을 100배 높이는 AI 경영의 실제

도서 구매

함께 읽으면 좋은 글:

디지털 트랜스포메이션: 조직의 습관을 바꾸는 일, 도서 구매

. .

ChatGPT 공유 링크가 검색엔진에 노출되고 있다? 개인정보 유출을 막기 위한 사용 팁

최근 뉴스에 따르면, 일부 사용자가 ChatGPT에서 생성한 공유 링크가 Google이나 Bing 같은 검색엔진에 노출되면서, 의도치 않게 민감한 정보가 외부에 드러나는 일이 발생했다고 합니다. 이번 글에서는 해당 사례의 배경과 기술적인 구조, 개인정보 보호를 위해 우리가 알아야 할 핵심 내용을 간단하면서도 실용적으로 소개해드리겠습니다.

ChatGPT 공유 링크, 검색엔진에 노출되다

ChatGPT에서 유용한 대화 내용을 공유하고자 ‘공유 링크 만들기’ 기능을 사용해보신 분도 많으실 겁니다. 이 기능을 사용하면 ‘/share’가 포함된 고유 URL이 생성되고, 이 링크를 받은 누구나 해당 내용을 열람할 수 있게 됩니다.

문제는 일부 공유 링크들이 검색엔진에 수집되면서 누구나 검색을 통해 타인의 AI 대화를 들여다볼 수 있었던 점입니다. 예를 들어 누군가는 이력서 첨삭을 요청했고, 다른 이는 사적인 연애나 직장 고민을 털어놓기도 했습니다. 이러한 대화들이 외부에 노출되며 개인정보 유출 사고로 이어졌습니다.

hero image 2

공유 링크는 왜 검색엔진에 노출되었나?

ChatGPT에서 대화를 공유하려면 ‘공유’ 버튼을 누른 뒤 ‘링크 생성’을 선택해야 합니다. 이때 별도의 설정을 변경하지 않으면 대부분의 경우 해당 링크는 검색엔진에 노출 가능한 상태로 생성됩니다. 검색로봇은 이 URL을 인터넷 상에서 감지하고 색인을 지정(인덱싱)함으로써 검색 결과에 포함시킵니다.

이는 Google Drive 등의 클라우드 서비스에서 종종 나타나는 보안 취약성과 유사합니다. ‘링크가 있는 모든 사람’에게 열람을 허용하면 그 링크가 의도치 않게 외부 웹사이트를 통해 확산되고, 결국 검색엔진에도 포착될 수 있습니다. 공유의 편의성은 높지만, 반면 프라이버시와 보안 측면에서는 명확한 한계가 존재합니다.

단순한 실험인가, 아니면 위험한 전환점인가?

OpenAI는 해당 상황이 실험적인 기능에 의해 발생했음을 인정하고, 현재는 검색엔진 인덱싱이 더 이상 허용되지 않도록 조치했다고 밝혔습니다. 그러나 이미 노출된 일부 링크는 아직 검색 결과에서 완전히 사라지지 않은 상태입니다.

이 사건은 단순한 사용자 실수가 아닙니다. AI 서비스가 일상생활 깊숙이 들어온 지금, 사용자 데이터 보호와 디지털 문해력 향상은 더 이상 선택이 아닌 필수입니다. 특히 ChatGPT의 경우, 사용 내용이 개인의 감정이나 경제 상황, 직업 정체성까지 드러낼 만큼 민감할 수 있기 때문에 각별한 주의가 필요합니다.

ChatGPT의 공유 기능은 어떻게 작동하나?

공유 기능은 사용자가 대화 내용을 다른 사람과 나누고 싶을 때 유용하게 쓰입니다. 해당 기능을 실행하면 ‘chat.openai.com/share/고유값’ 형태의 URL이 자동 생성되고, 보기 편한 형식으로 대화 내용이 정리되어 나타납니다. 이 링크에는 사용자의 이름이나 이후 대화 내용은 포함되지 않지만, 중요한 점은 생성된 링크만 있으면 누구든 그 내용을 그대로 확인할 수 있다는 사실입니다.

초기 설정에서는 이 링크가 검색엔진에 노출될 수 있는 상태였기 때문에, 의도치 않게 외부 공개로 이어지는 사고가 발생했던 것입니다.

사용자 실수인가, 시스템 설계의 문제인가?

많은 전문가들은 이 문제를 단순한 사용자 실수로 보기 어렵다고 말합니다. 특히 공유 링크가 기본적으로 검색엔진 수집을 허용하는 구조로 설계되어 있었다는 점에서 시스템 설계상의 결함이라는 지적도 나옵니다.

개인정보 유출을 막으려면 어떻게 해야 하나?

사용자 입장에서 개인정보 보호를 위한 몇 가지 실천 방법이 있습니다. 첫째, 공유 버튼을 누르기 전 내용 중 민감한 표현이나 개인정보가 포함되지 않았는지 점검하셔야 합니다. 이름, 전화번호, 직장 정보 등은 반드시 제거하시는 것이 좋습니다.

둘째, 링크 생성 후 ‘검색엔진 노출 허용’ 여부를 꼭 확인하셔야 합니다. 옵션이 있다면 비활성화 상태로 설정하시고, 가능한 경우 일반 링크 생성 자체를 피하는 것도 좋은 방법입니다.

셋째, 가족이나 친구, 직장 동료 등 제3자의 이름이나 정보를 대화에 포함시키는 것은 권장되지 않습니다. 개인정보는 본인 것뿐만 아니라 타인의 정보도 포함될 수 있음을 인지하셔야 합니다.

넷째, 민감한 주제에 대해서는 가급적 공유를 삼가시는 것이 좋습니다. 특히 금융, 건강, 진로 등 개인의 중요한 의사결정과 관련된 질문은 외부 유출될 경우 의도치 않은 결과를 초래할 수 있습니다.

기업 사용자라면, 더욱 각별한 주의가 필요합니다

많은 기업들이 사내 문서 정리, 마케팅 문안 작성, 보고서 요약 등 다양한 업무에 ChatGPT를 도입하고 있습니다. 하지만 만일 직원이 이런 대화를 공유 링크로 저장하거나 메신저 등에서 전달한다면, 내부 문서나 고객 정보, 혹은 제품 로드맵이 외부에 노출될 가능성도 있습니다.

특히 마케팅, 전략기획, R&D, 법무 부서에서 다루는 문서 정보는 기업의 핵심 자산일 수 있습니다. 따라서 기업은 AI 도구 활용 시 내부 보안 정책을 명문화하고, 전 직원 대상의 사이버 보안 교육을 정기적으로 시행할 필요가 있습니다.

결론: AI 시대, 책임 있는 사용 문화가 필요합니다

ChatGPT를 포함한 AI 서비스는 빠르게 진화하고 있습니다. 그리고 이에 따라 사용자 개인의 책임감뿐만 아니라, 개발사의 윤리적 설계 능력 역시 더욱 중요해지고 있습니다. 결국 우리는 ‘편리함보다 신중함’이라는 원칙을 기억해야 합니다.

AI를 잘 활용한다는 것은 기술을 스마트하게 쓰는 것을 넘어, 우리의 개인정보와 사회적 신뢰를 지키는 일이기도 합니다. 이번 사례가 올바른 AI 도구 사용 문화를 다시 생각하게 하는 계기가 되기를 바랍니다.

출처: Your public ChatGPT queries are getting indexed by Google and other search engines

ChatGPT 공유 링크
AX 100배의 법칙
AX 100배의 법칙
– 나와 조직의 능력을 100배 높이는 AI 경영의 실제

도서 구매

함께 읽으면 좋은 글:

디지털 트랜스포메이션: 조직의 습관을 바꾸는 일, 도서 구매

. .