며칠 전까지 “AI가 너무 위험해지고 있다”고 경고하던 회사가, 바로 그 며칠 뒤에 자사 역대 최강 모델을 일반에 풀었습니다. Anthropic이 2026년 6월 9일 공개한 Claude Fable 5 이야기입니다.
좀 모순처럼 들리죠? 그런데 이번 발표의 진짜 핵심이 바로 거기에 있습니다. Anthropic은 “능력 그 자체”를 자랑한 게 아니라, 그 능력에 안전장치를 어떻게 붙여서 제품으로 분리·포장했는가를 보여줬습니다. 그게 바로 Fable 5와 Mythos 5라는 두 이름으로 나뉜 이유고요.
저는 출시 직후부터 Fable 5를 실제 작업에 붙여서 며칠 굴려봤습니다. 이 글은 발표문 요약이 아니라, “그래서 내 업무에 뭐가 달라지는지”에 초점을 맞춘 도입 판단 가이드입니다. 결론부터 말하면 인상적인 모델인 건 맞는데, 모든 작업에 Fable 5를 쓰는 게 정답은 아닙니다. 언제 쓰고 언제 Opus로 충분한지를 아는 게 진짜 실력이에요.
30초 요약 (TL;DR)
- Claude Fable 5 = 일반에 공개된 Anthropic 최강 모델. 안전 분류기 내장.
- Claude Mythos 5 = Fable 5와 동일한 기반 모델. 안전 분류기 없이, 승인된 조직(사이버 보안·생물학 연구 등)에만 제한 공개.
- 가격: 입력 100만 토큰당 $10, 출력 100만 토큰당 $50. (Opus 4.8 대비 약 2배)
- 핵심 성능: SWE-Bench Pro 80.3% (Opus 4.8은 69.2%).
- 컨텍스트: 100만 토큰. 모델 ID는claude-fable-5.
- 무료 기간: Pro/Max/Team/Enterprise 구독자는 6월 22일까지 추가 비용 없이 사용. 6월 23일부터는 사용 크레딧 차감.
이 글에서는 다음 네 가지에 답합니다. (1) Fable 5와 Mythos 5가 도대체 뭐가 다른지, (2) 벤치마크 숫자가 내 작업에 실제로 어떤 의미인지, (3) 어떻게 시작하는지, (4) Opus 4.8 대신 2배 값을 언제 내야 하는지.
Claude Fable 5와 Mythos 5, 한 문장으로 정리하면¶
핵심 한 줄: 둘은 같은 두뇌, 다른 출입증입니다.
이름이 둘이라 처음엔 “성능이 다른 두 모델인가?” 싶지만, 아닙니다. Fable 5와 Mythos 5는 동일한 기반 모델을 공유합니다. 두뇌는 똑같아요. 차이는 오직 안전장치와 접근 권한, 즉 어떤 출입증을 들고 들어가느냐입니다.
Claude 5 패밀리란 무엇인가¶
Fable 5와 Mythos 5는 Anthropic의 새 Claude 5 패밀리의 첫 모델입니다. 그리고 이 둘은 기존 Opus 등급보다 한 단계 위인 “Mythos급(Mythos-class)”이라는 새 최상위 티어에 속합니다.
그러니까 등급 순서로 보면 이렇습니다. 기존에 우리가 알던 최상위가 Opus였다면, 이제 그 위에 Mythos급이 새로 생긴 거예요. Fable 5는 그 Mythos급 성능을 일반 사용자가 처음으로 손에 쥘 수 있게 된 모델입니다.
Fable 5 vs Mythos 5 — 나는 뭘 쓰게 되나¶
실무자 입장에서 가장 궁금한 질문이죠. 결론부터: 여러분이 일반 개발자·기업이라면 사실상 Fable 5를 씁니다.
| 구분 | Claude Fable 5 | Claude Mythos 5 |
|---|---|---|
| 기반 모델 | 동일 | 동일 |
| 가용성 | 일반 공개(GA) — Claude API, AWS, Google Vertex AI, Microsoft Foundry | 제한 공개 — Project Glasswing 승인 고객 전용 |
| 대상 | 모든 개발자·기업 | 사이버 보안·생물학 연구 등 특정 분야 승인 파트너 |
| 안전 분류기 | 있음 (고위험 요청 거부 가능) | 없음 |
Mythos 5는 Project Glasswing이라는 프로그램을 통해 승인된 고객만 접근할 수 있습니다. 사이버 보안 분야 선정 파트너, 미국 정부 협력 등이 대상이고, 생물학 연구자를 위한 별도 프로그램도 예정돼 있습니다. 일반 신청으로 받을 수 있는 게 아니에요.
핵심은, Mythos 5에 접근할 수 없어도 동일한 능력의 Fable 5를 쓸 수 있다는 점입니다. 능력 손해를 보는 게 아니라, 안전 분류기를 통과하는 형태로 같은 두뇌를 쓰는 겁니다.
왜 “Fable”과 “Mythos”로 나눴나¶
여기서 도입부의 모순이 풀립니다. Anthropic은 강력한 능력을 풀고 싶지만, 그 능력이 악용되는 것도 막아야 합니다. 그 긴장을 제품 설계로 푼 결과가 이 분리예요.
- Fable 5: 안전 분류기를 달아서, 고위험 요청은 자동으로 걸러내거나 더 약한 모델로 우회시킨 채 일반에 공개.
- Mythos 5: 안전 분류기를 떼되, 신뢰할 수 있는 승인 조직(방어 목적 사이버 보안 연구자, 생물의학 연구자 등)에게만 제한 제공.
복수 언론(TechCrunch, CNBC)이 “AI가 너무 위험하다고 경고한 직후 최강 모델 공개”라는 맥락을 강조한 이유가 이겁니다. 자동 라우팅, 30일 데이터 보존 정책, Fable/Mythos 분리 — 전부 이 능력 대 안전의 긴장을 풀기 위한 장치들이에요.
벤치마크로 본 성능 — 숫자보다 “내 작업에 뭐가 달라지나”¶
핵심 한 줄: 짧고 단순한 작업은 별 차이 없고, 길고 복잡한 자율 작업에서 격차가 확 벌어집니다.
벤치마크 표를 그냥 나열하는 글은 많습니다. 여기서는 숫자 뒤에 “그래서 내 작업엔”을 꼭 붙이겠습니다.
코딩 벤치마크¶
| 벤치마크 | Fable 5 / Mythos 5 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-Bench Pro (에이전틱 코딩) | 80.3% | 69.2% | 58.6% | 54.2% |
| FrontierCode Diamond (xhigh effort) | 29.3% | 13.4% | 5.7% | — |
| Terminal-Bench 2.1 | 88.0% | 82.7% | — | — |
SWE-Bench Pro는 Anthropic 공식 발표 기준 수치이고, Terminal-Bench 2.1과 FrontierCode 세부 수치는 분석 매체(Vellum, Lushbinary 등) 집계값입니다. 표를 캡처해 공유하실 거라면 이 출처 구분을 알아두시는 게 좋습니다.
그래서 내 작업엔? SWE-Bench Pro 80.3%는 Opus 4.8(69.2%)보다 11%포인트 높습니다. 이게 결정적인 영역은 여러 파일을 오가며 멀티스텝으로 자율 작업하는 코딩입니다. 한 줄짜리 함수 고치기 같은 작업에선 체감 차이가 크지 않아요. 차이가 벌어지는 건 “긴 호흡으로 알아서 돌아가야 하는” 작업입니다.
그래서 실무에선? — Stripe 사례로 본 장기 자율 작업¶
가장 강력한 실사용 사례는 Stripe입니다. 5천만 줄 규모의 Ruby 코드베이스 마이그레이션을 단 하루에 완료했다고 Anthropic이 발표했습니다. 같은 작업을 사람 팀이 수작업으로 하면 2개월 이상 걸린다고 추정되던 일이죠.
이게 “내 작업에 뭐가 달라지나”의 가장 명확한 답입니다. Fable 5의 진짜 무기는 단발 응답 품질이 아니라 장기 호라이즌(long-horizon) 자율 작업이에요. 수십~수백 단계를 스스로 이어가며 흐트러지지 않는 능력. 프레임워크 마이그레이션, 대규모 리팩터링, 일주일 단위로 돌아가는 에이전트 — 이런 영역에서 격차가 납니다.
장기 기억 쪽 사례도 흥미롭습니다. Anthropic 자체 평가에서, 파일 기반 영속 메모리를 쓰는 작업(예: Slay the Spire 게임 플레이)에서 Opus 4.8보다 약 3배 더 나은 성능을 보였다고 합니다. 측정 방법론은 공개되지 않았으니 “Anthropic 자체 평가” 기준으로 받아들이시면 됩니다.
비전·지식 노동·롱컨텍스트¶
코딩 말고도 강점이 있습니다.
- 비전: 스크린샷만 보는(vision-only) 환경에서 포켓몬 게임을 클리어할 정도. 차트·PDF 추론 벤치마크(GDP.pdf)에서 29.8%로 Opus 4.8(22.5%)을 앞섰습니다.
- 지식 노동: 지식 노동 평가(GDPval-AA)에서 ELO 1932로, GPT-5.5(1769)·Gemini 3.1 Pro(1314)를 앞섭니다. 금융 분석(Hebbia 벤치마크)에서도 1위를 기록했고요.
- 롱컨텍스트: 컨텍스트 윈도우 100만 토큰. 대형 문서 묶음을 한 번에 넣고 종합하는 작업에 유리합니다.
벤치마크 함정 주의: BioMysteryBench·ExploitBench 같은 생물학·사이버 영역 고득점은 안전장치가 없는 Mythos 5 기준입니다. Fable 5는 해당 영역 요청이 Opus 4.8로 라우팅되기 때문에, 실사용에서는 그 점수에 도달하지 않을 수 있습니다. “Fable 5가 사이버 78%”라는 식의 표현은 정확하지 않으니 주의하세요. 또 GPT-5.5의 SWE-bench Verified 88.7%와 Fable 5의 SWE-Bench Pro 80.3%는 서로 다른 벤치마크입니다. Verified가 더 쉬운 세트라 직접 비교하면 안 됩니다. 동일 벤치마크(Pro)에서는 Fable 5(80.3%)가 GPT-5.5(58.6%)를 크게 앞섭니다.
가격과 6월 22일 무료 마감 — 지금 써봐야 하는 이유¶
핵심 한 줄: 구독자라면 6월 22일까지는 사실상 공짜로 테스트할 수 있습니다. 이게 가장 중요한 행동 포인트예요.
API 가격 — Opus 4.8 대비 약 2배¶
| 모델 | 입력 (100만 토큰) | 출력 (100만 토큰) |
|---|---|---|
| Claude Fable 5 | $10 | $50 |
| Claude Mythos 5 | $10 | $50 |
| (참고) Mythos Preview | 위 가격의 2배 이상 | 2배 이상 |
Fable 5와 Mythos 5는 가격이 같습니다. 그리고 Mythos Preview 시절 대비 절반 이하로 내려온 가격이긴 합니다. 다만 솔직하게 말하면, 주요 상용 모델 중에서는 가장 비쌉니다. 2026년 6월 기준 보도값으로 GPT-5.5(입력 $5/출력 $30)나 Gemini 3.1 Pro(입력 $2/출력 $12)와 비교하면 확연히 높아요.
그래서 가격 프리미엄을 정당화하려면 작업 난이도가 그만큼 높아야 합니다. 단순 요약이나 분류 작업에 Fable 5를 쓰는 건 돈 낭비예요.
비용을 줄이는 현실적인 방법 두 가지는 알아두세요.
- 프롬프트 캐싱: 캐시된 입력 토큰은 비캐시 대비 약 90% 저렴합니다. Claude Code처럼 같은 파일을 반복 작업하는 세션이면, 첫 몇 턴 이후 입력 토큰의 60~80%가 캐시될 수 있어 실질 비용이 크게 떨어집니다.
- 100만 토큰 전체가 표준 가격: 90만 토큰을 넣어도 토큰당 단가는 동일합니다. 롱컨텍스트라고 단가가 뛰지 않아요.
6월 22일 마감 — 그 다음엔 크레딧 과금¶
⏰ 긴급성 포인트
- 6월 9일 ~ 6월 22일: Pro, Max, Team, 좌석제 Enterprise 플랜에 추가 비용 없이 무료 포함.
- 6월 23일부터: 구독 플랜에서 제거됨 → 이후 사용은 사용 크레딧(usage credit) 필요.
- 오늘이 6월 11일이니, 남은 무료 테스트 기간은 약 11일입니다.
이게 이 글에서 제가 가장 강조하고 싶은 부분입니다. 구독자라면 지금이 가장 비싼 모델을 공짜로 검증해볼 수 있는 창이에요. 이 기간이 지나면 같은 테스트에 실제 크레딧이 나갑니다.
요금제별 접근 차이¶
- Pro / Max / Team / 좌석제 Enterprise: 위 일정대로 6/22까지 무료, 6/23부터 크레딧.
- API 및 사용량 기반(consumption-based) Enterprise: 출시일부터 즉시 사용 가능. (무료 기간 개념이 아니라 쓰는 만큼 과금)
Claude Fable 5 시작하기 — Claude 앱 · Claude Code · API¶
핵심 한 줄: 셋업은 3분, 핵심은 “Fable 5는 기본값이 아니라 명시적으로 골라야 한다”는 것뿐입니다.
Claude 앱/웹에서 바로 쓰기¶
가장 쉬운 길입니다. Pro·Max·Team·Enterprise 구독 상태로 claude.ai에 들어가, 모델 선택기에서 Fable 5를 고르면 끝입니다. (6/22까지 무료 포함, 6/23부터 크레딧)
Claude Code에서 쓰기¶
여기가 함정이 하나 있습니다. Fable 5는 어떤 계정 타입에서도 기본 모델이 아닙니다. 명시적으로 선택해야 해요.
# Claude Code 안에서
/model fable
/model fable로 선택하면 사용자 설정에 저장돼서, 이후 세션도 (바꾸기 전까지) Fable 5로 시작합니다. Fable 5가 가용한 환경이라면 best 별칭으로도 잡힙니다.
참고로 Pro/Max/Team/Enterprise 플랜의 Claude Code에서는 Fable 5와 Opus 4.8/4.7/4.6 모두 100만 토큰 컨텍스트를 지원합니다. 확장 사고(extended thinking)도 됩니다. 같은 파일·시스템 프롬프트를 반복 참조하는 작업이라면 프롬프트 캐싱이 자동으로 비용을 깎아주니, 위에서 말한 캐싱 효과를 가장 크게 보는 환경이 바로 Claude Code입니다.
API로 쓰기¶
모델 ID는 claude-fable-5입니다. 최소 코드는 모델명만 바꾸면 됩니다.
import anthropic
client = anthropic.Anthropic() # ANTHROPIC_API_KEY 환경변수 사용
message = client.messages.create(
model="claude-fable-5",
max_tokens=4096,
messages=[
{"role": "user", "content": "이 레거시 코드를 최신 프레임워크로 마이그레이션해줘"}
],
)
print(message.content)
Claude API 외에 AWS Bedrock, Google Vertex AI, Microsoft Foundry, OpenRouter 등에서도 같은 모델을 호출할 수 있습니다.
다만 API로 프로덕션 통합을 한다면, 모델명만 바꾸는 걸로 끝이 아닙니다. 거부(refusal) 처리와 폴백을 반드시 설계해야 하는데, 이건 안전장치 섹션에서 자세히 다루겠습니다.
Fable 5 vs Opus 4.8 — 2배 값을 언제 내야 하나 (의사결정 가이드)¶
핵심 한 줄: 기본은 Opus, 자율성 자체가 제품일 때 Fable입니다.
이 섹션이 사실 이 글에서 가장 실용적인 부분입니다. “더 좋은 모델이니까 무조건 Fable” 같은 결론은 돈을 태웁니다.
비교표¶
| 항목 | Claude Fable 5 | Claude Opus 4.8 |
|---|---|---|
| 등급 | Mythos급 (신규 최상위 티어) | Opus급 |
| SWE-Bench Pro | 80.3% | 69.2% |
| 가격 (입력/출력, 1M) | $10 / $50 | 약 절반 수준 |
| 컨텍스트 | 100만 토큰 | 100만 토큰 |
| 안전 분류기 | 있음 (거부 시 Opus 4.8로 폴백) | — |
| 가장 빛나는 작업 | 장기 자율 코딩, 대규모 마이그레이션, 일주일짜리 에이전트 | 일반 코딩, 대화, 분석 등 폭넓은 일상 작업 |
“이럴 땐 Fable, 이럴 땐 Opus” 체크리스트¶
이럴 땐 Fable 5를 쓰세요:
- [ ] 수십~수백 단계를 스스로 이어가야 하는 장기 자율 작업이다.
- [ ] 대규모 코드베이스 마이그레이션·리팩터링처럼 한 번 잘못 흐트러지면 손실이 큰 작업이다.
- [ ] 작업 난이도가 높아서 2배 가격을 정당화할 정도로 결과 품질이 비용보다 중요하다.
- [ ] 100만 토큰 롱컨텍스트로 대형 문서를 통째로 종합해야 한다.
- [ ] 지금이 6월 22일 이전이고, 실제 작업으로 성능을 검증해보고 싶다.
이럴 땐 Opus 4.8로 충분합니다:
- [ ] 단발성 질의응답, 요약, 분류, 일반 대화처럼 짧은 작업이다.
- [ ] 비용 효율이 중요하고, 품질 차이가 결과에 결정적이지 않다.
- [ ] 사이버 보안·생물 관련 요청이 많아 Fable 5에서 어차피 Opus로 폴백될 가능성이 높다.
- [ ] 이미 Opus 4.8 워크플로가 안정적으로 돌고 있고, 바꿀 이유가 뚜렷하지 않다.
쉽게 외우는 한 줄: 자율성이 곧 제품인 작업엔 Fable, 그 외 일상 작업은 Opus. 그리고 경쟁 모델까지 고려한다면 “하나로 표준화하지 말고 작업별로 라우팅하라”가 핵심입니다 — 비용 민감한 고볼륨 작업은 Gemini 3.1 Pro, 초장문 검색은 GPT-5.5, 하드한 장기 코딩은 Fable 5, 이런 식으로요.
안전장치와 실무자가 본 진짜 주의점¶
핵심 한 줄: 안전장치는 전체 세션의 5% 미만에서만 작동하지만, 작동하면 Opus로 폴백된다는 걸 미리 알아야 합니다.
이 부분은 대부분의 글이 “안전장치 있음” 한 줄로 넘어가는데, 실무에선 여기가 통합 설계를 가르는 지점입니다.
3종 분류기와 폴백 구조¶
Fable 5에는 위험 요청을 탐지하는 AI 분류기가 세 영역에 내장돼 있습니다.
- 사이버 보안: 사이버 공격 및 “에이전틱 해킹” 진행 차단.
- 생물학·화학: 고위험 이중용도(dual-use) 능력 차단.
- 증류(Distillation): 프런티어 LLM을 복제하려는 능력 추출 차단(프롬프트 변조, steering vector, PEFT 등).
작동 방식이 실무적으로 중요합니다.
- 위험 요청 탐지 시 → 더 약한 모델인 Opus 4.8로 자동 라우팅되고, 사용자에게 통지됩니다.
- API에서는
stop_reason: "refusal"을 HTTP 200 정상 응답으로 반환합니다. 에러가 아니에요. 어느 분류기가 거부했는지도 함께 옵니다. - 발동률은 평균 전체 세션의 5% 미만입니다.
- Anthropic도 현재 필터가 “너무 공격적이라 무해한 요청까지 막을 수 있다”고 인정하고 있습니다.
API로 프로덕션 통합을 한다면 세 가지를 반드시 대비하세요.
- 거부 처리:
stop_reason: "refusal"응답을 핸들링하는 분기를 추가합니다. - 폴백 설계: 거부된 요청은 보통 다른 Claude 모델로 처리 가능합니다. 서버사이드
fallbacks파라미터(beta), SDK 미들웨어, 수동 재시도 중 하나를 고르세요. - 과금 이해: 출력 생성 전에 거부된 요청은 과금되지 않습니다. 다른 모델로 재시도할 때는 fallback credit으로 프롬프트 캐시 전환 비용이 환불돼, 캐시 비용을 이중으로 내지 않습니다.
데이터 보존 30일¶
엔터프라이즈라면 알아둘 점. Fable 5는 30일 보존 후 삭제, 학습에는 사용하지 않습니다. 다만 Zero Data Retention(ZDR)은 불가합니다(Covered Model로 지정됨). ZDR이 계약 조건인 조직이라면 이 부분을 도입 전에 확인하셔야 합니다.
실무자가 본 진짜 주의점¶
마지막으로, 써본 사람으로서 솔직한 한계를 짚겠습니다.
프로덕션 코드 리뷰 게이트는 여전히 사람(혹은 Opus) 병행을 권합니다. Fable 5의 자율성은 강점이지만, 동시에 주의할 점이기도 합니다. 빌려온 명령어나 스니펫을 “확인한 뒤 실행”하기보다 “일단 실행하고 나서 고치는” 경향이 관찰됩니다. 짧은 작업에선 문제없지만, 되돌리기 어려운 작업이나 프로덕션 환경에서는 이게 리스크가 됩니다.
그래서 제 권장 워크플로는 이렇습니다. 탐색·생성·대규모 변경은 Fable 5에게 맡기되, 최종 머지 게이트에는 사람 리뷰나 Opus 교차 검토를 둔다. 자율성을 끄라는 게 아니라, 자율성이 강할수록 게이트를 분명히 두자는 겁니다.
참고로 안전성 검증 수치도 있습니다. 사이버 공격 작업에서 Fable 5는 “0% 성공률”(즉 공격을 무력화), 외부 레드팀이 1,000시간 넘게 테스트했지만 범용 탈옥(universal jailbreak)을 찾지 못했다고 Anthropic이 밝혔습니다.
결론 — 당신은 지금 무엇을 해야 하나¶
길게 봤으니 페르소나별로 딱 한 줄씩 정리하겠습니다.
- “이게 뭔데 화제야?” (정보 탐색자): Fable 5 = 일반 공개 최강, Mythos 5 = 같은 두뇌의 제한판. 이 한 줄이면 대화에서 안 밀립니다.
- “Opus 쓰던 사람” (업그레이드 검토자): 위 체크리스트로 판단하세요. 장기 자율 작업이 많으면 Fable, 일상 작업이면 Opus 유지가 합리적입니다.
- “지금 써보려는 사람” (실행자):
/model fable또는 모델 IDclaude-fable-5. 그리고 6월 22일 전에 실제 작업 하나로 돌려보세요. - “리스크가 걱정되는 리드”: 5% 미만 발동·Opus 폴백·30일 보존(ZDR 불가)을 체크하고, 머지 게이트는 사람 병행으로 설계하세요.
가장 확실한 행동 하나만 꼽으라면: 6월 22일이 지나기 전에, 당신의 실제 업무 중 가장 까다로운 작업 하나를 Fable 5로 직접 돌려보세요. 벤치마크 숫자 100개를 읽는 것보다, 내 작업 하나를 돌려보는 게 도입 판단에 훨씬 정확합니다. 무료 창이 열려 있는 지금이 그 비용이 0인 유일한 시기입니다.
자주 묻는 질문 (FAQ)¶
Q. 페이블 5와 미토스 5, 뭐가 다른가요?
기반 모델은 동일합니다. Fable 5는 안전 분류기가 내장돼 일반에 공개됐고, Mythos 5는 분류기 없이 Project Glasswing 승인 조직(사이버 보안·생물학 연구 등)에만 제한 제공됩니다. 일반 사용자는 사실상 Fable 5를 씁니다.
Q. 클로드 페이블 5, 무료로 쓸 수 있나요?
Pro·Max·Team·좌석제 Enterprise 구독자는 6월 9일부터 6월 22일까지 추가 비용 없이 사용할 수 있습니다. 6월 23일부터는 사용 크레딧이 차감됩니다.
Q. Opus 4.8보다 꼭 좋은가요?
장기 자율 작업·대규모 마이그레이션·복잡한 코딩에서는 확실히 앞섭니다(SWE-Bench Pro 80.3% vs 69.2%). 하지만 짧고 단순한 작업에선 체감 차이가 작고, 가격은 약 2배입니다. 작업 성격에 따라 갈라 쓰는 게 정답입니다.
Q. 모델 ID와 컨텍스트 윈도우는요?
API 모델 ID는 claude-fable-5(Mythos는 claude-mythos-5), 컨텍스트 윈도우는 100만 토큰, 최대 출력은 요청당 128K 토큰입니다.
Q. 안전장치가 내 작업을 막을 수 있나요?
사이버 보안·생물/화학·모델 증류 영역의 고위험 요청은 거부되거나 Opus 4.8로 자동 폴백될 수 있습니다. 발동률은 전체 세션의 5% 미만이지만, API 통합 시에는 stop_reason: "refusal" 처리와 폴백 설계를 권장합니다.
이 글의 수치와 모델 정보는 2026년 6월 9일 Anthropic 공식 발표 시점 기준입니다. 핵심 팩트(가격·스펙·SWE-Bench Pro·무료 기간)는 공식 발표·문서를 1차 출처로 확인했고, Terminal-Bench 등 일부 세부 벤치마크와 경쟁 모델 수치는 분석 매체 집계값(2026년 6월 기준 보도값)입니다. 생물학·사이버 영역 고득점은 안전장치 없는 Mythos 5 기준이라 Fable 5 실사용 점수와 다를 수 있습니다.
참고 자료: Anthropic 공식 발표 · Claude API 문서 · Claude Code 모델 설정