월요일에 쓰던 AI 모델이 금요일에 구모델이 되는 경험을 해본 적 있는가. 2026년 3월, 나는 정확히 그 상황을 4번 반복했다. GPT-5.4가 나오고 2주 뒤에 Gemini 3.1이 나왔고, NVIDIA GTC에서 에이전트 인프라가 발표됐고, Sora가 조용히 문을 닫았다. 23일 만에 프론티어 모델 4종이 쏟아진 건 AI 역사상 처음이다.

이 글은 뉴스를 나열하는 글이 아니다. AI를 매일 실무에 쓰는 사람으로서, 이 한 달간의 변화가 실제로 내 업무에 뭘 바꿨는지를 정리한 기록이다. “그래서 나한테 뭐가 달라지는데?”라는 질문에 답하는 것이 목표다.

이 글에서 다루는 것:
- GPT-5.4의 컴퓨터 사용 기능이 실무에서 어떤 의미인지
- “에이전틱 AI”가 정확히 뭐고, 왜 지금 갑자기 화두인지
- Sora가 왜 실패했고, 거기서 배울 수 있는 교훈
- GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 — 용도별 선택 기준
- 개발자, 비개발자, 의사결정자 각각이 지금 당장 해볼 수 있는 것


들어가며 — 23일 만에 세계가 4번 뒤집혔다

2026년 3월 AI 주요 이벤트 4가지를 보여주는 타임라인 인포그래픽

3월의 AI 이벤트를 시간순으로 정리하면 이런 그림이 나온다.

날짜 사건 한 줄 임팩트
3/5 GPT-5.4 출시 AI가 내 화면을 보고 직접 조작하기 시작
3/16~ NVIDIA GTC 2026 에이전트 인프라가 기업 표준으로 올라섬
3/20 Gemini 3.1 Pro 출시 추론 분야 1위 탈환, 가격 파괴
3/22 Grok 4.20 출시 환각률 최저, 실시간 검색 특화
3/24 Sora 서비스 종료 AI 비디오 사업의 경제적 한계 노출

평소에도 AI 업계는 빠르지만, 3월은 차원이 달랐다. 단순히 모델 하나가 나온 게 아니라, AI가 작동하는 방식 자체가 바뀌는 전환점이었다. “질문하면 답하는 AI”에서 “목표를 주면 알아서 실행하는 AI”로의 이동. 이 글 전체를 관통하는 키워드는 바로 이것이다.

핵심 포인트: 2026년 3월의 본질은 개별 모델의 성능 향상이 아니다. AI가 “대화 상대”에서 “업무 파트너”로 역할이 바뀌기 시작한 것이다.


GPT-5.4 — “AI가 내 화면을 본다”의 의미

GPT-5.4의 컴퓨터 사용 기능을 시각화한 일러스트로 AI가 화면을 보고 자율적으로 조작하는 모습

GPT-5.4 출시 당일 API를 연결해서 써봤다. 스펙시트를 보는 것과 직접 쓰는 것은 다른 차원의 경험이다.

컴퓨터 사용(Computer Use) API가 진짜로 바꾸는 것

GPT-5.4의 가장 큰 변화는 네이티브 컴퓨터 사용 기능이다. 스크린샷을 인식하고, 마우스를 클릭하고, 키보드를 입력하는 걸 API로 제어할 수 있다. OSWorld 벤치마크에서 75%를 기록했는데, 이건 인간 성능(72.4%)을 넘어선 수치다.

쉽게 말하면, “Excel 매크로의 다음 단계”가 왔다는 뜻이다.

Before (기존 자동화):

1. API가 있는 서비스만 자동화 가능
2. 각 서비스마다 개별 연동 코드 작성 필요
3. UI가 바뀌면 스크립트 전체 수정

After (GPT-5.4 컴퓨터 사용):

1. 화면만 있으면 어떤 서비스든 자동화 가능
2. "이 화면에서 X를 해줘"라고 지시하면 끝
3. UI가 바뀌어도 AI가 시각적으로 적응

실무에서 이걸 어디에 쓸 수 있냐면, 리포트 자동 생성(사내 시스템에서 데이터 뽑아서 포맷 맞추기), 웹 데이터 수집(크롤러 대신 AI가 직접 브라우징), 레거시 시스템 자동 조작(API가 없는 구형 사내 시스템도 자동화) 같은 작업이다. 특히 API가 없는 사내 시스템을 자동화할 수 있다는 점이 엔터프라이즈 환경에서 가장 큰 의미를 갖는다.

100만 토큰 컨텍스트 — 실제로 써보니

GPT-5.4는 API에서 최대 105만 토큰을 지원한다. 코드베이스 전체를 한 번에 넣는 경험은, 파일 단위로 쪼개서 설명하던 시절과 비교하면 작업 효율이 확연히 다르다.

다만 솔직히 말하면, 100만 토큰을 꽉 채워 쓰는 상황은 생각보다 많지 않다. 대부분의 실무 작업은 27만 토큰 이내에서 해결된다. “100만 토큰이 필요하다”와 “100만 토큰을 쓸 수 있다”는 다른 문제다. Gemini 3.1의 200만 토큰과 비교해서 용량 자체보다 중요한 건 긴 컨텍스트에서 정보를 정확히 찾아내는 능력이다. Claude Opus 4.6이 MRCR v2 8-needle 1M 테스트에서 76%를 기록한 반면, Sonnet 4.5는 18.5%에 그친 것이 좋은 예시다. 컨텍스트 길이보다 이해의 정확도가 실무에서 더 중요하다.

GPT-5.4 Standard vs Thinking vs Pro — 용도별 선택 가이드

항목 Standard Thinking Pro
용도 일반 업무, 대화 코딩, 복잡한 추론 최고 성능 필요한 작업
가격 (M토큰) $2.50 / $15 중간 $30 / $180
핵심 강점 균형 잡힌 성능 단계별 추론 최적화 BrowseComp 89.3%, ARC-AGI-2 83.3%
추천 대상 대부분의 사용자 개발자, 분석가 연구자, 고난이도 자동화

“Pro에 월 30만 원을 쓸 가치가 있느냐”는 솔직히 대부분의 사용자에게는 아니다. Pro는 FrontierMath Tier 4에서 38%를 기록할 정도로 극한의 추론 성능이 필요한 연구/분석 업무에 특화돼 있다. 일반 실무자라면 Standard로 시작해서, 코딩이나 복잡한 분석이 필요할 때 Thinking을 쓰는 게 비용 대비 가장 합리적이다.

또 하나 주목할 점은 Tool Search 메커니즘이다. 전체 토큰 사용량을 47% 줄이면서 정확도를 유지한다. 250개 태스크 기준으로 검증된 수치인데, API 비용을 아끼면서 성능을 유지할 수 있다는 건 프로덕션 환경에서 꽤 의미 있는 차이다.

핵심 포인트: GPT-5.4의 진짜 변화는 벤치마크 수치가 아니라 “컴퓨터를 직접 조작한다”는 패러다임 전환이다. 여기에 100만 토큰과 Tool Search가 더해져, AI 자동화의 실용성이 크게 올라갔다.


에이전틱 AI — “시키면 하는 AI”에서 “알아서 하는 AI”로

생성형 AI와 에이전틱 AI의 차이를 비교하는 개념도, 단발 응답 대 자율 워크플로우

3월의 모든 소식을 관통하는 하나의 키워드가 있다면, 에이전틱 AI(Agentic AI)다. GPT-5.4의 컴퓨터 사용, NVIDIA의 에이전트 툴킷, MCP의 폭발적 성장 — 전부 같은 방향을 가리키고 있다.

에이전틱 AI란 무엇인가 (비개발자도 이해하는 설명)

가장 쉬운 비유를 들어보겠다.

  • 생성형 AI(기존): 인턴에게 업무를 하나씩 시키는 것. “이거 번역해줘”, “저거 요약해줘”. 시킨 것만 하고 멈춘다.
  • 에이전틱 AI(지금): 경력직 팀원에게 역할을 맡기는 것. “이 프로젝트 마감까지 관리해줘”. 스스로 계획을 세우고, 필요한 도구를 찾아 쓰고, 문제가 생기면 알아서 판단한다.

핵심 차이는 단발 응답 vs 목표 지향 자율 행동이다. 에이전틱 AI는 하나의 목표를 받으면 여러 단계를 스스로 계획하고, 외부 도구를 호출하고, 중간 결과를 검증하면서 최종 목표까지 도달한다.

왜 지금 갑자기 이게 가능해졌냐면, 세 가지 조건이 동시에 갖춰졌기 때문이다.

  1. 100만 토큰 컨텍스트: 긴 작업 맥락을 유지할 수 있게 됨
  2. 컴퓨터 사용/도구 사용 기능: AI가 외부 세계와 상호작용 가능
  3. MCP 같은 표준 프로토콜: 도구 연결의 벽이 사라짐

이 세 가지가 합쳐지니까, 이론이 아닌 실제 제품으로 에이전트가 나오기 시작한 것이다.

NVIDIA GTC 2026이 보여준 기업 에이전트 시대

3월 16일 시작된 NVIDIA GTC 2026에서 발표된 것들의 핵심은 이거다: 에이전틱 AI가 실험 단계를 넘어 기업 표준으로 올라가고 있다.

NVIDIA가 발표한 핵심 인프라를 정리하면:

  • NemoClaw: 보안 런타임 + 샌드박스 환경. 에이전트가 안전하게 작업할 수 있는 울타리를 제공한다.
  • Agent Toolkit: NemoClaw + Nemotron 모델 + AI-Q 블루프린트를 합친 올인원 패키지.
  • Nemotron 3 Super: 120B 파라미터(12B 활성) 하이브리드 모델로, GPT-OSS-120B 대비 처리량 2.2배.

여기서 가장 주목할 숫자는 이것이다: Adobe, SAP, Salesforce 등 17개 기업이 동시 채택했다는 사실. 그리고 에이전트 쿼리 비용이 기존 대비 50% 절감된다는 점. 기업 입장에서는 “에이전트를 도입할 이유”가 비용 절감이라는 구체적 수치로 뒷받침되기 시작한 것이다.

Gartner는 2025년에 5% 미만이던 에이전트 탑재 엔터프라이즈 앱 비율이 2026년 말까지 40%에 이를 것으로 전망했다. McKinsey는 에이전틱 AI의 연간 가치를 2.6~4.4조 달러로 추산한다. 이미 AI 에이전트에 투자한 기업 비율은 75%, 실제 배포/파일럿 단계에 진입한 기업은 42%다(IBM 조사).

MCP 9,700만 설치 — 에이전트의 “USB 포트”가 표준이 됐다

MCP(Model Context Protocol)를 가장 쉽게 설명하면, AI 모델과 외부 도구를 연결하는 “USB 포트”다. 예전에는 AI 모델이 슬랙에 메시지를 보내려면 별도의 연동 코드를 짜야 했다. MCP가 있으면 표준 방식으로 연결만 하면 된다.

3월 기준 주요 수치:
- 월간 SDK 다운로드: 9,700만+
- 등록 MCP 서버: 10,000개+ (공식 레지스트리만 6,400개 이상)
- 지원 플랫폼: ChatGPT, Claude, Cursor, Gemini, VS Code, MS Copilot

“REST API가 웹의 표준이 되는 데 5년이 걸렸는데, MCP는 16개월 만에 해냈다”는 평가가 나올 정도다.

특히 중요한 전환점은, Anthropic이 MCP를 Linux Foundation 산하 Agentic AI Foundation(AAIF)에 기부한 것이다. OpenAI의 AGENTS.md, Block의 goose와 함께 AAIF의 창립 프로젝트가 됐다. 한 회사의 프로토콜이 아니라 업계 공동 표준으로 자리 잡은 셈이다.

실무자에게 이게 의미하는 바: 도구 통합에 들이던 시간이 수개월에서 수주로 줄어들고, 개발 비용이 최대 70% 절감되며, 6개월 내 생산성이 35~40% 향상된다는 조사 결과가 있다.

핵심 포인트: 에이전틱 AI는 버즈워드가 아니다. 100만 토큰 + 도구 사용 + MCP 표준화, 이 세 가지가 맞물리면서 실제로 작동하는 AI 에이전트가 가능해진 원년이 2026년 3월이다.


Sora의 퇴장 — AI 비즈니스에서 배우는 냉정한 교훈

AI 비디오 서비스 Sora의 종료를 상징하는 일러스트, 필름 릴이 디지털 입자로 흩어지는 모습

3월 24일, OpenAI가 Sora 앱을 종료했다. 출시 6개월 만이다. 이건 단순한 서비스 종료가 아니라, AI 비즈니스 전체에 대한 경고 신호다.

하루 추론 비용 1,500만 달러의 무게

숫자가 모든 걸 말해준다.

항목 수치
피크 다운로드 333만
종료 직전 다운로드 113만 (2개월 만에 66% 급감)
인앱 매출 약 $210만
하루 추론 비용 $1,500만
디즈니 투자 파기 $10억 규모

인앱 매출 $210만 vs 하루 추론 비용 $1,500만. 이 수학이 맞지 않는다는 건 누가 봐도 명확하다. 디즈니가 $10억 투자를 철회한 건 Sora만의 문제가 아니라, AI 스타트업의 약속이 경제적으로 지속 가능한가에 대한 시장의 의문을 반영한다.

OpenAI도 이를 인정했다. Sora 연구팀은 로보틱스 분야의 “월드 시뮬레이션 연구”로 전환한다고 발표했다. Sora 종료가 OpenAI IPO 준비의 일환이라는 분석도 나온다. 2026년 Q4 예상 IPO를 앞두고, 수익 구조를 정비하는 과정에서 가장 큰 비용 누수를 먼저 틀어막은 셈이다.

Sora가 남긴 질문: 어떤 AI 워크로드가 경제적으로 지속 가능한가

Sora 사태에서 배울 수 있는 교훈은 세 가지다.

첫째, “능력이 된다”와 “사업이 된다”는 전혀 다른 문제다. Sora는 기술적으로 인상적이었다. 하지만 비디오 생성의 추론 비용 구조는 텍스트 생성과 근본적으로 다르다. 텍스트 생성은 토큰 단위로 비용이 선형적이지만, 비디오 생성은 프레임 수, 해상도, FPS에 따라 비용이 기하급수적으로 올라간다.

둘째, 사용자 유지가 관건이다. 피크 333만 다운로드에서 2개월 만에 113만으로 떨어진 건, 초기 호기심 이후 실질적 가치를 제공하지 못했다는 뜻이다. “와 신기하다” 단계를 넘어 “매일 쓰는 도구”가 되려면 다른 차원의 가치 제안이 필요하다.

셋째, 비디오 AI 시장이 재편되고 있다. Sora가 빠진 자리에 오픈소스 대안이 부상하고 있다. Lightricks의 LTX-2.3은 22B 파라미터로 4K/50FPS 비디오+오디오 생성을 Apache 2.0 라이선스로 제공한다. Google의 Veo도 강력한 후보다.

이건 모든 AI 프로젝트에 적용되는 질문이다: “이 워크로드의 추론 비용 구조는 비즈니스 모델과 양립하는가?” Sora는 이 질문에 “아니오”라는 답을 내놓은 첫 번째 대형 사례다.

핵심 포인트: Sora의 실패는 기술 실패가 아니라 경제성 실패다. AI 프로젝트를 시작할 때 “이게 기술적으로 가능한가”뿐 아니라 “이게 지속 가능한 비용 구조를 가지고 있는가”를 반드시 함께 물어야 한다.


2026년 3월 프론티어 모델 대결 — 실무자의 선택 기준

GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro, Grok 4.20 네 모델의 벤치마크 성능 비교 시각화

3월 기준, 프론티어 모델들의 성능이 놀라울 정도로 수렴하고 있다. SWE-bench 기준으로 GPT-5.4(80.0%), Claude Opus 4.6(80.8%), Gemini 3.1 Pro(80.6%)가 1% 안에서 경쟁한다. 이제 “어떤 모델이 최고냐”보다 “어떤 업무에 어떤 모델이 최적이냐”가 핵심 질문이 됐다.

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro vs Grok 4.20

벤치마크 종합 비교:

벤치마크 GPT-5.4 Claude Opus 4.6 Gemini 3.1 Pro 승자
SWE-bench (코딩) 80.0% 80.8% 80.6% Opus
GPQA Diamond (추론) 92.8% 91.3% 94.3% Gemini
ARC-AGI-2 (추상 추론) 73.3% 75.2% 77.1% Gemini
OSWorld (컴퓨터 사용) 75% 72.7% - GPT
BigLaw Bench (법률) 91% - - GPT
MMMU Pro (시각 추론) - 85.1% - Opus

가격 비교 (M토큰당):

모델 입력 출력 가성비 메모
Gemini 3.1 Pro $2 $12 최저가 프론티어 모델
Grok 4.20 $2 $15 실시간 검색 포함 가격
GPT-5.4 Standard $2.50 $15 컴퓨터 사용 기능 포함
Claude Sonnet 4.6 $3 $15 Opus급 성능의 1/5 가격
Claude Opus 4.6 $15 $75 코딩/에이전트 최강

“최고의 모델”은 없다 — 용도별 최적 조합

벤치마크와 실제 써본 체감을 종합하면, 용도별 최적 모델은 이렇게 갈린다.

업무 추천 모델 이유
코딩/코드리뷰 Claude Opus 4.6 SWE-bench 1위(80.8%), 에이전틱 코딩 특화
컴퓨터 자동화 GPT-5.4 네이티브 Computer Use, OSWorld 75%
과학/수학 추론 Gemini 3.1 Pro GPQA 94.3%, Deep Think 모드
긴 문서 분석 Gemini 3.1 Pro 200만 토큰 컨텍스트
법률 분석 GPT-5.4 BigLaw Bench 91%
비용 최적화 Claude Sonnet 4.6 Opus의 98% 성능을 1/5 가격에
셀프호스팅 Mistral Small 4 Apache 2.0, 6B 활성 파라미터

실무 조언 하나: 한 모델에 올인하지 말고, MCP로 용도별 라우팅하라. 코딩은 Opus, 분석은 Gemini, 자동화는 GPT-5.4. 이렇게 조합하는 게 현시점에서 가장 합리적인 전략이다.

참고로 오픈소스 진영도 약진이 눈에 띈다. Mistral Small 4는 119B 파라미터(6B 활성)로 추론+멀티모달+코딩을 단일 모델에 통합했고, Apache 2.0 라이선스다. Alibaba의 Qwen 3.5-9B는 MMMU-Pro 시각 추론에서 70.1을 기록해 GPT-5-Nano(57.2)를 22.5% 앞섰다. 프라이버시와 데이터 주권이 중요한 환경이라면 셀프호스팅 가능한 오픈소스 모델이 현실적 대안이 되고 있다.

핵심 포인트: 프론티어 모델 성능이 수렴한 시대, “최고의 모델”을 찾는 것보다 “용도별 최적 조합”을 만드는 것이 실무적으로 훨씬 가치 있다.


실무자를 위한 액션 가이드 — 지금 당장 해볼 수 있는 것

개발자, 비개발 실무자, 의사결정자 세 가지 역할별 AI 활용 가이드 일러스트

여기까지 읽었다면, “그래서 나는 뭘 해야 하나”라는 질문이 남았을 것이다. 역할별로 정리했다.

개발자라면

1. GPT-5.4 Computer Use API로 E2E 테스트 자동화 시작하기

가장 빠르게 체감할 수 있는 영역이다. 기존 Playwright나 Selenium 기반 테스트와 달리, 셀렉터가 바뀌어도 AI가 화면을 보고 적응한다.

# 기존 방식 (셀렉터 기반)
page.click('#submit-button')  # 버튼 ID가 바뀌면 깨짐

# GPT-5.4 Computer Use 방식
"화면에서 '제출' 버튼을 찾아 클릭해줘"  # UI가 바뀌어도 동작

2. MCP 서버 구축해서 사내 도구와 AI 연결하기

MCP 공식 레지스트리에 6,400개 이상의 서버가 등록되어 있다. 슬랙, GitHub, Jira 등 주요 도구용 MCP 서버는 이미 준비되어 있으니, 설치 후 바로 AI에 연결할 수 있다. 사내 전용 도구가 있다면 커스텀 MCP 서버를 만드는 것도 고려해볼 만하다.

3. 멀티에이전트 워크플로우 실험하기

Claude Code의 에이전트 모드나 GPT-5.4의 Tool Search를 활용해 복수 에이전트가 협업하는 워크플로우를 실험해보자. PR 리뷰 → 보안 스캔 → 자동 수정까지 연결하는 파이프라인이 실제로 가능한 수준에 와 있다.

비개발 실무자라면

1. ChatGPT에서 GPT-5.4로 전환 후 데이터 분석 업무 테스트

Plus 구독에서 바로 GPT-5.4를 쓸 수 있다. 특히 데이터 분석, 리포트 생성, 시장 조사 같은 업무에서 이전 모델 대비 차이를 체감할 수 있다. GDPval 벤치마크에서 44개 직종 전문가 수준(83%)을 기록했는데, 실무 체감도 이전보다 확실히 좋아졌다.

2. “AI 에이전트 파일럿”을 팀에 제안할 때의 프레이밍

팀에 AI 에이전트 도입을 제안하고 싶다면, 이런 프레이밍이 효과적이다:
- “비용 절감”보다 “반복 업무 시간 절약”으로 접근
- 팀당 월 40시간+ 절약이라는 구체적 수치 제시
- 작고 명확한 파일럿(예: 주간 보고서 자동 생성)부터 시작 제안
- Sora 사례를 들어 “작게 시작해서 ROI 검증 후 확대” 전략 강조

3. 반복 업무 목록 정리 → 에이전트 자동화 후보 식별

매주 반복하는 업무를 리스트업하고, 그중 “규칙이 명확하고, 실수 위험이 낮고, 사람의 창의적 판단이 불필요한” 작업을 에이전트 자동화 후보로 식별하자.

의사결정권자라면

1. NVIDIA Agent Toolkit 도입 검토

Adobe, SAP, Salesforce 등 17개 기업이 동시 채택한 데는 이유가 있다. 에이전트 쿼리 비용 50% 절감이라는 구체적 ROI가 확인됐기 때문이다. 자사 환경에 NemoClaw 기반 에이전트 도입이 가능한지 기술 팀과 검토해보는 것을 권한다.

2. Sora 실패에서 배우는 AI 프로젝트 ROI 검증

모든 AI 프로젝트에 이 질문을 던져보자: “추론 비용 구조가 우리 비즈니스 모델과 양립하는가?” 기술적으로 가능한 것과 경제적으로 지속 가능한 것은 별개다. 작은 파일럿으로 비용 구조를 검증한 후 확대하는 것이 안전하다.

3. 현실적 타임라인과 비용 기대치 설정

에이전트 도입은 하룻밤에 되는 게 아니다. 현실적 타임라인은 이렇다:
- 1~2개월: 파일럿 영역 선정, MCP 기반 도구 연결
- 3~4개월: 소규모 팀에서 파일럿 운영, ROI 측정
- 5~6개월: 검증된 영역으로 확대 적용

IBM 조사에 따르면 현재 에이전틱 AI 배포/파일럿 단계 기업이 42%다. 아직 시작하지 않았더라도 너무 늦은 건 아니지만, 곧 업계 표준이 될 것이다.

핵심 포인트: 어떤 역할이든 “작게 시작해서 검증하고 확대”가 원칙이다. 3월의 기술 발전은 실제로 활용 가능한 수준에 와 있다. 중요한 건 시작하는 것이다.


마무리 — 에이전트 시대, 불안보다 준비가 먼저다

AI 에이전트 시대를 맞이하는 실무자가 밝은 미래를 향해 나아가는 모습

2026년 3월을 한 문장으로 요약하면 이렇다: “AI가 대화 상대에서 업무 파트너로 바뀌기 시작했다.”

GPT-5.4는 화면을 보고 직접 조작하기 시작했고, MCP는 모든 도구를 AI와 연결하는 표준이 됐고, NVIDIA는 에이전트 인프라를 기업에 납품하기 시작했다. 동시에 Sora의 퇴장은 “기술적으로 가능하다”와 “사업적으로 된다”가 다르다는 냉정한 교훈을 남겼다.

과장하고 싶은 마음은 없다. AI 에이전트가 당장 모든 업무를 대체하진 않는다. SWE-bench 80%라는 건, 여전히 20%는 제대로 못 한다는 뜻이기도 하다. 컴퓨터 사용 기능도 아직 복잡한 멀티스텝 작업에서는 실수가 잦다.

하지만 방향은 분명하다. 그리고 그 방향으로의 이동 속도가 빠르다.

“AI가 일을 대체하는 게 아니라, AI를 쓸 줄 아는 사람이 못 쓰는 사람을 대체한다”는 말이 점점 현실이 되고 있다. 불안해하기보다는, 지금 이 시점에서 할 수 있는 작은 실험부터 시작하는 게 낫다.

다음 달 주목할 것

  • Apple Siri 재탄생: Gemini 기반 Siri 업그레이드가 iOS 26.5(5월)로 지연됐지만, 1.2조 파라미터 모델로 Siri를 완전히 재설계한다. Apple이 장기적으로 Gemini, Claude 등 복수 AI를 Siri에 연결하는 시스템(iOS 27)을 탐색 중이라는 점도 주목해야 한다.
  • OpenAI IPO 움직임: 2026년 Q4 예상. $1,200억 규모 펀딩 라운드가 진행 중이고, 기업:소비자 매출 비율을 50:50으로 재편 중이다.
  • EU AI Act 본격 시행 준비: 8월 2일 투명성 의무 시행을 앞두고, AI 생성 콘텐츠 마킹/라벨링 표준이 구체화되고 있다. 글로벌 서비스를 운영하는 기업이라면 컴플라이언스 준비를 서둘러야 한다.

이 글이 유용했다면, 팀 동료에게 공유해주세요. 다음 달에도 AI 업계의 핵심 변화를 실무자 관점으로 정리해서 찾아오겠습니다.