2026. 6. 9.
2026년 6월 9일, Anthropic이 새 최상위 모델 Claude Fable 5를 출시했습니다. 같은 날, 안전 분류기를 뺀 동일 모델 Claude Mythos 5도 함께 발표됐습니다. 공식 문서, 매체 보도, 커뮤니티 반응을 출시 24시간 안에 모아서 정리했습니다.
제동 장치만 다른 두 모델이, 같은 날 동시에 출시됐습니다.
claude-fable-5와 claude-mythos-5. 아키텍처가 같은 두 모델이 같은 날 발표됐습니다. Mythos 5는 안전 분류기를 뺀 버전이고, 초대제 프로그램 Project Glasswing을 통해서만 쓸 수 있습니다. 이름은 라틴어 fabula(이야기)와 그리스어 mythos(신화)에서 왔지만, 글쓰기 특화 모델이라는 뜻은 아닙니다. 공식 문서가 밝힌 구분 기준은 하나입니다. 안전 분류기가 있으면 Fable, 없으면 Mythos입니다.

claude-fable-5
전체 공개claude-mythos-5
Project Glasswing 초대제컨텍스트
[A]1M
1M
최대 출력
[A]128K
128K
토크나이저
[A]Opus 4.7 도입분
Opus 4.7 도입분
Thinking
[A]adaptive 상시
adaptive 상시
가격 (in / out, MTok)
[A]$10 / $50
$10 / $50
SWE-bench Verified
[C]95.0%
95.5%
안전 분류기
[A]탑재
제거
공급 채널
[A]전체 공개
초대제 한정
I thought they said mythos was too dangerous to make generally available?
Mythos는 너무 위험해서 일반 공개 못 한다고 하지 않았나?
위험하다면서 초대제로는 공개하는 게 모순이라는 지적
쌍둥이 이야기는 여기까지입니다.
그렇다면 전작 Opus 4.8과는 무엇이 다를까요?
이 모델은 thinking을 끌 수 없습니다. 끄려고 하면 400 에러가 납니다.
Opus 4.8과 "거의 호환"이지만 세 가지가 다릅니다. thinking 강제, 안전 분류기, 가격 2배.
같은 Messages API, 같은 1M 컨텍스트, 같은 128K 출력, 같은 토크나이저를 씁니다. 마이그레이션 가이드는 "거의 그대로 교체 가능"이라고 설명합니다. 다른 건 세 가지입니다. adaptive thinking이 항상 켜져 있고, thinking을 disabled로 보내면 400 에러가 나고, 가격이 2배입니다. 추론 없이 빠르게 답하는 모드가 아예 없는 첫 모델입니다.

{
"model": "claude-fable-5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": "결제 화면의 주문 버튼 문구를 추천해줘"
}
]
}Opus 4.7
thinking을 끌 수 있었습니다
Opus 4.8
미설정 시 thinking 없음
Fable 5
thinking이 강제됩니다
API 차이는 여기까지입니다.
다음은 이 모델에 새로 생긴 "거부"라는 동작입니다.
Fable 5가 거부하면, Opus 4.8이 대신 답합니다.
먼저, "거부"가 뭔가요?
검사 장치가 들어 있습니다
Fable 5 안에는 안전 분류기라는 검사 장치가 내장되어 있습니다. 오가는 요청과 응답을 자동으로 검사합니다.
위험하면 답을 멈춥니다
검사에서 위험한 주제(해킹 방법, 위험 물질 제조 등)로 판정되면 모델이 답변을 멈춥니다. 이 동작이 거부(refusal)이고, 응답에 stop_reason: refusal 표시가 남습니다.
왜 이번에 생겼나
모델이 강해질수록 위험한 질문에도 정확하게 답할 수 있게 됩니다. 그래서 Anthropic이 처음으로 검사 장치를 모델에 붙여서 출시했습니다. 검사 없이 쓰려면 초대제 Mythos 5로 가야 합니다.
cyber
사이버 공격 능력 오남용
bio
생물학적 위험 정보
reasoning_extraction
추론 과정을 그대로 옮겨 적으라는 요청. 흔한 프롬프트 패턴이 여기 걸립니다
거부가 일어나도 HTTP 200이 돌아옵니다. 응답만 보면 어느 모델이 답했는지 알 수 없습니다.
거부가 일어났을 때 그냥 에러로 끝나면 그 위에 만든 서비스도 같이 멈춥니다. 그래서 fallbacks라는 장치가 함께 나왔습니다. fallbacks를 설정해 두면, Fable 5가 거부한 요청을 전작 Opus 4.8이 이어받아 대신 답합니다. 결과는 에러가 아니라 HTTP 200, 즉 정상 응답으로 돌아오고, 실패한 호출의 캐시 비용은 환불됩니다. 사용자 화면에는 평범한 응답 하나만 보입니다. Anthropic은 이 개입이 전체 요청의 약 0.03%에서 일어난다고 밝혔습니다. 커뮤니티 논쟁은 개입 비율이 아니라, 개입이 일어났다는 사실을 사용자가 알 수 없다는 점에 집중됐습니다.
10,000건 중 3건꼴로 개입이 일어납니다. 비율은 작지만, 개입이 사용자에게 보이지 않는다는 점이 논쟁이 됐습니다.
사용자가 예를 들어 라이신 같은 독극물을 어떻게 만드느냐 같은 위험이 높은 질문을 하면 이 모델은 대답을 중단하고 클로드 오퍼스 4.8로 되돌아가 안전한 답을 내놓도록 돼 있다
출시 익일 한국 8개 매체가 동시에 보도했습니다. 프레임은 동일합니다. "미토스급 모델의 안전판 공개 버전".
safeguards will not be visible to the user... impact ~0.03% of traffic
안전장치가 사용자에게 보이지 않으며, 트래픽 약 0.03%에 영향을 준다
폴백이 사용자 모르게 일어난다는 점을 비판한 댓글
거부와 폴백은 여기까지입니다.
그렇다면 실제 성능은 어느 정도일까요?
쉬운 벤치마크에서는 차이가 작고, 어려운 벤치마크일수록 차이가 커집니다.
단순 코딩 점수가 아니라, 길고 복잡한 작업의 완수율이 다릅니다.
SWE-bench Verified에서 Fable 5는 95.0%입니다. 분류기를 뺀 Mythos 5는 95.5%로, 차이가 0.5%p뿐입니다. 이 벤치마크는 이미 점수가 포화 상태라 변별력이 없습니다. 어려운 벤치마크로 가면 달라집니다. SWE-bench Pro에서는 Opus 4.8과 11%p 차이, FrontierCode에서는 2배 이상 차이가 납니다. 즉 차이는 단순 코딩이 아니라 길고 복잡한 작업의 완수율에서 납니다. Stripe는 5천만 줄 Ruby 마이그레이션 작업 기간을 2개월에서 1일로 줄였다고 발표했습니다.
이미 모두 95% 근처라 변별력이 없는 벤치마크입니다.
성능 차이는 확인했습니다.
이 성능에, 전작의 2배가격이 붙습니다.
$10 / $50. 전작의 정확히 2배입니다.
토큰당 가격은 2배지만, 작업 하나를 끝내는 비용으로 보면 계산이 달라집니다.
입력 $10, 출력 $50. Opus 4.8의 정확히 2배입니다. HN에서는 출시 30분 만에 가격 불만이 올라왔습니다. 반대쪽 계산도 있습니다. 12콜 에이전트 체인 하나를 끝내는 데 약 $15가 들고, 저가 모델은 같은 작업을 아예 완수하지 못했다는 비교입니다. 작업을 완수하지 못하면 토큰값이 싸도 의미가 없습니다. GitHub도 "이전 Opus 티어보다 tool call 수와 토큰 소비가 적다"고 명시했습니다. 어느 단위로 재느냐에 따라 결론이 달라집니다.
토큰당 가격으로 비교하면 Fable 5가 가장 비쌉니다.
Fable 5 hit $200/month subscription in <30 min
출시 30분 만에 월 $200 구독 한도에 도달했다
2배 가격에 대한 직접적인 불만HN 서브스레드I am not looking forward to how it will empower the people who submit bug bounties to us.
버그바운티 제출자들을 이 모델이 얼마나 강하게 만들지 걱정된다
보안 연구자의 우려sebmellen여기까지가 출시 24시간의 사실입니다.
그렇다면 이 모든 게 무엇을 의미할까요?
지금까지 본 네 가지는, 하나의 설계를 가리킵니다.
예전에는 안전을 모델 학습 안에 구워 넣었습니다. Fable 5는 안전을 모델 밖 시스템(검사 장치 + 거부 + 폴백)으로 꺼냈습니다.
쌍둥이 모델
분류기 하나만 떼면 Mythos가 됩니다. 안전이 모델에 굳어 있는 성질이 아니라, 붙였다 뗄 수 있는 부품이 됐다는 뜻입니다.
thinking 강제
이 정도 능력의 모델은 검토 없이 바로 답하면 안 된다는 선언입니다. 끄는 옵션을 아예 없앴습니다.
거부
안전 개입을 예외 상황이 아니라 정식 응답 종류로 만들었습니다. stop_reason과 과금 체계에 포함됩니다.
Opus 폴백
거부해도 전작이 이어받습니다. 능력의 세대 사다리를 그대로 안전의 사다리로 다시 씁니다.
강한 모델을 빨리 쓴다
위험한 부분만 따로 거르니까, 출시를 미루지 않고 능력은 그대로 내보냈습니다.
거부당해도 안 멈춘다
Opus 4.8이 이어받아 정상 응답으로 돌려줍니다. 그 위에 만든 서비스가 안 끊깁니다.
손해를 덜 본다
거부로 실패한 호출은 캐시 비용을 환불합니다.
안전 수준을 고른다
일반은 분류기가 켜진 Fable, 심사 통과자는 원본 Mythos를 씁니다.
개입이 안 보인다
받은 답이 Fable이 쓴 건지, 거부돼서 Opus가 대신 쓴 건지 알 수 없습니다.
멀쩡한 요청도 막힌다
"추론을 보여줘" 같은 흔한 프롬프트가 reasoning_extraction으로 거부될 수 있습니다.
안전판 버전 배분이 새 문제
떼어낸 Mythos를 누구에게 줄지가 권력 문제가 됩니다. 심사 기준은 비공개입니다.
비싸다
가격이 전작의 2배입니다. 단순 호출 용도면 부담이 큽니다.
장점과 단점이 같은 설계에서 나옵니다. 안전을 모델 밖으로 꺼냈기 때문에 강한 모델을 안 끊기게 쓸 수 있고, 바로 그 때문에 안전장치가 사용자 모르게 작동합니다. 편의와 투명성을 맞바꾼 모델입니다.
이 종합은 공식 발표의 사실들에서 끌어낸 해석입니다. Anthropic이 이 문장 그대로 밝힌 입장은 아닙니다.성능 수치 밖의 특징, 작업 성향입니다.
짧은 지시로 제어되지만, 내버려두면 서술이 길어집니다.
공식 문서가 설명하는 Fable 5의 작업 성향입니다. 며칠에 걸친 목표 지향 작업을 유지하고, 긴 지시 나열 없이 짧은 지시로 제어되고, subagent를 더 적극적으로 씁니다. 단점도 명시되어 있습니다. 조정하지 않으면 서술이 길어지고, 드물게 요청하지 않은 행동(이메일 초안, git 백업)을 하고, 긴 세션에서 일찍 멈추거나 불필요하게 허가를 구하는 경우가 보고됐습니다.
멀티-데이 실행
[A]며칠에 걸친 목표 지향 작업을 유지합니다. 지시를 오래 기억하고 따릅니다.
짧은 지시
[A]제약을 길게 나열하지 않아도 대부분 제어됩니다.
위임과 병렬
[A]subagent를 더 적극적으로 쓰고, 비동기 협업이 안정적입니다.
과다 서술
[A]조정하지 않으면 옵션 나열과 원인 설명이 길어지는 경향이 있습니다.
미요청 행동
[A]드물게 요청하지 않은 이메일 초안 작성, git 백업 같은 행동이 보고됐습니다.
조기 종료
[A]긴 세션에서 일찍 멈추거나 불필요하게 허가를 구하는 경우가 있습니다.
이 리포트의 리서치와 페이지 제작은 Fable 5로 작업했습니다.
위에 적힌 작업 성향은 실제 작업 과정에서도 비슷하게 나타났습니다.
확인된 것과, 아직 확인되지 않은 것
출시일 2026-06-09 · 모델 ID claude-fable-5 · Opus 위 최상위 티어 신설
쌍둥이 claude-mythos-5 (안전 분류기 제거) · Project Glasswing 한정 공급
1M 컨텍스트 / 128K 출력 · adaptive thinking 강제 · 가격 $10/$50
refusal stop_reason + fallbacks 파라미터 · prompt cache 최소 512토큰
Stripe / Cognition / Pokémon 등 사례 기반 성능 주장
표준 벤치 정량 점수 다수: System Card 원문 미검증, 2차 매체 전사값
Reddit 실사용 후기: 도메인 차단으로 미확보
한국어권 심층 후기: 출시 익일이라 미생성 추정
레이턴시 / throughput 실측치: 정성 서술만 존재
토크나이저 증가율: 공식 문서 내 30% vs 35% 표기 불일치
출시 24시간 기준의 정리는 여기까지입니다. System Card 원문과 실사용 후기가 쌓이면 미확인 항목부터 업데이트가 필요합니다.