클로드 페이블 5 정리: 쌍둥이 모델, thinking 강제, 자동 폴백

2026. 6. 9.

2026년 6월 9일, Anthropic이 새 최상위 모델 Claude Fable 5를 출시했습니다. 같은 날, 안전 분류기를 뺀 동일 모델 Claude Mythos 5도 함께 발표됐습니다. 공식 문서, 매체 보도, 커뮤니티 반응을 출시 24시간 안에 모아서 정리했습니다.

claude-fable-5

claude-mythos-5

Tier Legend

[A]공식[B]매체[C]커뮤니티

모든 수치에 출처 등급을 표시합니다. A는 공식 문서, B는 매체 보도, C는 커뮤니티 발언입니다. 아직 확인되지 않은 정보는 맨 아래 미확인 목록에 따로 모았습니다.

Act 1 · The Twin

제동 장치만 다른 두 모델이, 같은 날 동시에 출시됐습니다.

claude-fable-5와 claude-mythos-5. 아키텍처가 같은 두 모델이 같은 날 발표됐습니다. Mythos 5는 안전 분류기를 뺀 버전이고, 초대제 프로그램 Project Glasswing을 통해서만 쓸 수 있습니다. 이름은 라틴어 fabula(이야기)와 그리스어 mythos(신화)에서 왔지만, 글쓰기 특화 모델이라는 뜻은 아닙니다. 공식 문서가 밝힌 구분 기준은 하나입니다. 안전 분류기가 있으면 Fable, 없으면 Mythos입니다.

fig 1. 거울처럼 같은 두 스택, 차이는 오른쪽에 붙은 분류기 하나

claude-fable-5

전체 공개

claude-mythos-5

Project Glasswing 초대제

컨텍스트

[A]

최대 출력

[A]

128K

토크나이저

[A]

Opus 4.7 도입분

Thinking

[A]

adaptive 상시

가격 (in / out, MTok)

[A]

$10 / $50

SWE-bench Verified

[C]

95.0%

95.5%

안전 분류기

[A]

탑재

제거

공급 채널

[A]

전체 공개

초대제 한정

8개 항목 중 6개가 같습니다. 다른 건 안전 분류기와 공급 채널 2개뿐입니다.

[A]

모델 · 같은 날 출시

[A]

차이점 · 안전 분류기

[C]

0.5%p

SWE-bench Verified 격차

I thought they said mythos was too dangerous to make generally available?

Mythos는 너무 위험해서 일반 공개 못 한다고 하지 않았나?

위험하다면서 초대제로는 공개하는 게 모순이라는 지적

bjord[C]

[A]

Project Glasswing: Mythos 5의 유일한 공급 채널: Mythos 5는 일반 공급되지 않습니다. Project Glasswing이라는 초대제 프로그램을 통해서만 쓸 수 있습니다. 안전 분류기 없는 모델을 누구에게 줄지는 이 프로그램의 심사 기준에 달려 있는데, 그 기준은 아직 공개되지 않았습니다.

invite-only trusted access program

[A]

이름은 글쓰기 특화라는 뜻이 아닙니다: Fable(라틴어 fabula, 이야기)과 Mythos(그리스어, 신화)라는 이름 때문에 창작 특화 모델로 오해하기 쉽습니다. 공식 문서가 밝힌 구분 기준은 안전 분류기 유무 하나입니다. 계보상으로는 Claude Mythos Preview라는 선행 모델이 먼저 있었고, Fable 5는 거기에 분류기를 더한 공개 버전입니다.

fabula = the thing that is told

쌍둥이 이야기는 여기까지입니다.

그렇다면 전작 Opus 4.8과는 무엇이 다를까요?

이 모델은 thinking을 끌 수 없습니다. 끄려고 하면 400 에러가 납니다.

Opus 4.8과 "거의 호환"이지만 세 가지가 다릅니다. thinking 강제, 안전 분류기, 가격 2배.

같은 Messages API, 같은 1M 컨텍스트, 같은 128K 출력, 같은 토크나이저를 씁니다. 마이그레이션 가이드는 "거의 그대로 교체 가능"이라고 설명합니다. 다른 건 세 가지입니다. adaptive thinking이 항상 켜져 있고, thinking을 disabled로 보내면 400 에러가 나고, 가격이 2배입니다. 추론 없이 빠르게 답하는 모드가 아예 없는 첫 모델입니다.

fig 2. 스택 가운데에 박혀 빼낼 수 없는 thinking 레이어

{
  "model": "claude-fable-5",
  "max_tokens": 1024,
  "messages": [
    {
      "role": "user",
      "content": "결제 화면의 주문 버튼 문구를 추천해줘"
    }
  ]
}

"thinking": "enabled"

thinking

...

Thinking Policy Timeline

[A]

Opus 4.7

adaptive · disabled 허용

thinking을 끌 수 있었습니다

[A]

Opus 4.8

adaptive · disabled 허용

미설정 시 thinking 없음

[A]

Fable 5

adaptive 상시 · disabled = 400

thinking이 강제됩니다

[A]

thinking disabled 시 에러

[A]

1M / 128K

컨텍스트 / 출력 · Opus와 동일

[A]

토큰 · prompt cache 최소 (기존 절반)

[A]

thinking을 끌 수 없는 첫 모델: Opus 4.8까지는 thinking을 disabled로 설정할 수 있었습니다. Fable 5는 adaptive thinking이 항상 켜져 있고, disabled를 보내면 400 invalid_request_error가 돌아옵니다. 추론 없이 빠르게 답하는 모드가 API에서 제거됐습니다.

thinking: { type: 'disabled' } → 400

[A]

prompt cache 최소 단위가 절반이 됐습니다: 가격은 2배가 됐는데, prompt cache 최소 단위는 1,024토큰에서 512토큰으로 절반이 됐습니다(Bedrock은 1,024). 짧은 시스템 프롬프트도 캐시할 수 있어서, 캐시를 잘 쓰면 인상분 일부를 상쇄할 수 있습니다.

cache min: 1,024 → 512 tokens

API 차이는 여기까지입니다.

다음은 이 모델에 새로 생긴 "거부"라는 동작입니다.

Fable 5가 거부하면, Opus 4.8이 대신 답합니다.

먼저, "거부"가 뭔가요?

[A]

검사 장치가 들어 있습니다

Fable 5 안에는 안전 분류기라는 검사 장치가 내장되어 있습니다. 오가는 요청과 응답을 자동으로 검사합니다.

[A]

위험하면 답을 멈춥니다

검사에서 위험한 주제(해킹 방법, 위험 물질 제조 등)로 판정되면 모델이 답변을 멈춥니다. 이 동작이 거부(refusal)이고, 응답에 stop_reason: refusal 표시가 남습니다.

[A]

왜 이번에 생겼나

모델이 강해질수록 위험한 질문에도 정확하게 답할 수 있게 됩니다. 그래서 Anthropic이 처음으로 검사 장치를 모델에 붙여서 출시했습니다. 검사 없이 쓰려면 초대제 Mythos 5로 가야 합니다.

Refusal Categories

[A]

cyber

사이버 공격 능력 오남용

[A]

bio

생물학적 위험 정보

[A]

reasoning_extraction

추론 과정을 그대로 옮겨 적으라는 요청. 흔한 프롬프트 패턴이 여기 걸립니다

거부가 일어나도 HTTP 200이 돌아옵니다. 응답만 보면 어느 모델이 답했는지 알 수 없습니다.

거부가 일어났을 때 그냥 에러로 끝나면 그 위에 만든 서비스도 같이 멈춥니다. 그래서 fallbacks라는 장치가 함께 나왔습니다. fallbacks를 설정해 두면, Fable 5가 거부한 요청을 전작 Opus 4.8이 이어받아 대신 답합니다. 결과는 에러가 아니라 HTTP 200, 즉 정상 응답으로 돌아오고, 실패한 호출의 캐시 비용은 환불됩니다. 사용자 화면에는 평범한 응답 하나만 보입니다. Anthropic은 이 개입이 전체 요청의 약 0.03%에서 일어난다고 밝혔습니다. 커뮤니티 논쟁은 개입 비율이 아니라, 개입이 일어났다는 사실을 사용자가 알 수 없다는 점에 집중됐습니다.

Fallback Sequence

User

위험도 높은 요청 전송

claude-fable-5

stop_reason: 'refusal'

safety classifier 작동

API

fallbacks: [claude-opus-4-8] 자동 재시도

사용자에게 비노출 · cache 환불

User

HTTP 200 · 평범해 보이는 응답 수신

어느 모델이 답했는지 응답만으로는 알 수 없습니다

[A]

10,000건 중 3건꼴로 개입이 일어납니다. 비율은 작지만, 개입이 사용자에게 보이지 않는다는 점이 논쟁이 됐습니다.

[B]

사용자가 예를 들어 라이신 같은 독극물을 어떻게 만드느냐 같은 위험이 높은 질문을 하면 이 모델은 대답을 중단하고 클로드 오퍼스 4.8로 되돌아가 안전한 답을 내놓도록 돼 있다

파이낸셜뉴스 · 2026-06-10

출시 익일 한국 8개 매체가 동시에 보도했습니다. 프레임은 동일합니다. "미토스급 모델의 안전판 공개 버전".

[C]

safeguards will not be visible to the user... impact ~0.03% of traffic

안전장치가 사용자에게 보이지 않으며, 트래픽 약 0.03%에 영향을 준다

폴백이 사용자 모르게 일어난다는 점을 비판한 댓글

Philpax · Hacker News

[A]

0.03%

안전 개입 트래픽

[A]

0%+

폴백 없는 세션

[A]

거부 카테고리

[A]

거부인데도 HTTP 상태 코드

[A]

reasoning_extraction: 흔한 프롬프트가 거부당할 수 있습니다: 거부 카테고리 3종 중 cyber와 bio는 예상 범위입니다. 세 번째인 reasoning_extraction은 "추론 과정을 응답에 그대로 옮겨 적어라"는 요청을 거부합니다. 기존 프롬프트와 스킬에 흔하게 들어 있는 패턴이라, 옮겨 타기 전에 쓰던 프롬프트를 점검해야 합니다.

refusal_category: 'reasoning_extraction'

[A]

거부되면 캐시 비용이 환불됩니다: fallbacks를 설정하면 거부 시 Opus 4.8이 자동으로 재시도하고, 실패한 Fable 5 호출의 prompt cache 비용은 환불됩니다. 거부를 에러가 아니라 과금까지 설계된 정상 동작으로 취급한다는 뜻입니다.

stop_reason: 'refusal' → fallback credit

거부와 폴백은 여기까지입니다.

그렇다면 실제 성능은 어느 정도일까요?

쉬운 벤치마크에서는 차이가 작고, 어려운 벤치마크일수록 차이가 커집니다.

단순 코딩 점수가 아니라, 길고 복잡한 작업의 완수율이 다릅니다.

SWE-bench Verified에서 Fable 5는 95.0%입니다. 분류기를 뺀 Mythos 5는 95.5%로, 차이가 0.5%p뿐입니다. 이 벤치마크는 이미 점수가 포화 상태라 변별력이 없습니다. 어려운 벤치마크로 가면 달라집니다. SWE-bench Pro에서는 Opus 4.8과 11%p 차이, FrontierCode에서는 2배 이상 차이가 납니다. 즉 차이는 단순 코딩이 아니라 길고 복잡한 작업의 완수율에서 납니다. Stripe는 5천만 줄 Ruby 마이그레이션 작업 기간을 2개월에서 1일로 줄였다고 발표했습니다.

Fable 5

95%

Mythos 5

95.5%

이미 모두 95% 근처라 변별력이 없는 벤치마크입니다.

[C]

이미 모두 95% 근처라 변별력이 없는 벤치마크입니다.

주의: 위 수치 다수는 System Card 원문이 아니라 2차 매체 전사값입니다(tier B/C). SWE-bench Verified와 Pro는 서로 다른 벤치라 직접 비교할 수 없습니다. AIME / MMMU / ARC-AGI 정량값은 확인된 출처에서 미공개입니다.

[B]

0%p

SWE-bench Pro · Opus 4.8과 격차

[B]

2.2x

FrontierCode · Opus 4.8 대비

[A]

일 · Stripe 5천만 줄 (기존 2개월)

[A]

Stripe: 5천만 줄, 2개월에서 1일로: Stripe는 5천만 줄 규모의 Ruby 마이그레이션 작업 기간을 Fable 5로 2개월에서 1일로 줄였다고 발표했습니다. 한 번의 응답 품질이 아니라, 며칠짜리 작업을 끊기지 않고 끝까지 수행하는 능력에 대한 사례입니다.

50M LOC: 2 months → 1 day

[A]

장기 작업 능력을 게임으로 측정했습니다: 장기 작업 능력 평가에 게임 Slay the Spire가 쓰였습니다. 메모리를 활용했을 때 성과가 3배 좋아졌습니다. 비전 평가도 게임입니다. Pokémon FireRed를 화면 인식만으로(vision-only) 클리어했습니다.

memory on: 3x improvement

[B]

공격 성공률 5.4%: 가장 큰 차이는 방어력입니다: Attack Success Rate(프롬프트 주입 공격 성공률, 낮을수록 안전)에서 Fable 5는 5.4%, Opus 4.8은 56.6%로 전해집니다. 코딩 점수 차이보다 훨씬 큰 10배 차이입니다. 안전 분류기와 별개로, 모델 자체의 공격 방어력이 크게 올라갔다는 수치입니다.

ASR 5.4% vs 56.6% (lower is safer)

성능 차이는 확인했습니다.

이 성능에, 전작의 2배가격이 붙습니다.

$10 / $50. 전작의 정확히 2배입니다.

토큰당 가격은 2배지만, 작업 하나를 끝내는 비용으로 보면 계산이 달라집니다.

입력 $10, 출력 $50. Opus 4.8의 정확히 2배입니다. HN에서는 출시 30분 만에 가격 불만이 올라왔습니다. 반대쪽 계산도 있습니다. 12콜 에이전트 체인 하나를 끝내는 데 약 $15가 들고, 저가 모델은 같은 작업을 아예 완수하지 못했다는 비교입니다. 작업을 완수하지 못하면 토큰값이 싸도 의미가 없습니다. GitHub도 "이전 Opus 티어보다 tool call 수와 토큰 소비가 적다"고 명시했습니다. 어느 단위로 재느냐에 따라 결론이 달라집니다.

$ / MTok (출력)

Fable 5

$50

Opus 4.8

$25

[A]

토큰당 가격으로 비교하면 Fable 5가 가장 비쌉니다.

[A]GitHub 공식: "이전 Opus 티어 모델보다 tool call 수와 토큰 소비가 적다"

[C]

Fable 5 hit $200/month subscription in <30 min

출시 30분 만에 월 $200 구독 한도에 도달했다

2배 가격에 대한 직접적인 불만HN 서브스레드

[C]

I am not looking forward to how it will empower the people who submit bug bounties to us.

버그바운티 제출자들을 이 모델이 얼마나 강하게 만들지 걱정된다

보안 연구자의 우려sebmellen

[A]

가격 · Opus 4.8 대비

[B]

12콜 에이전트 체인 완료 비용

[A]

일 · Copilot 데이터 보존 의무

[A]

Copilot 통합 조건: 30일 데이터 보존: GitHub Copilot에 출시 당일 도입됐지만 조건이 있습니다. 안전 분류기 운영을 위해 30일 데이터 보존이 필수입니다(학습에는 사용되지 않음). 분류기 운영이 데이터 보관 정책에도 영향을 준다는 뜻입니다.

30-day retention required (not for training)

[A]

Enterprise에서는 기본 꺼짐: Copilot Enterprise / Business에서 Fable 5는 기본 비활성 상태입니다. 팀에 도입하려면 관리자가 수동으로 켜야 합니다.

default: disabled (admin opt-in)

여기까지가 출시 24시간의 사실입니다.

그렇다면 이 모든 게 무엇을 의미할까요?

지금까지 본 네 가지는, 하나의 설계를 가리킵니다.

한 줄로 줄이면

예전에는 안전을 모델 학습 안에 구워 넣었습니다. Fable 5는 안전을 모델 밖 시스템(검사 장치 + 거부 + 폴백)으로 꺼냈습니다.

쌍둥이 모델

분류기 하나만 떼면 Mythos가 됩니다. 안전이 모델에 굳어 있는 성질이 아니라, 붙였다 뗄 수 있는 부품이 됐다는 뜻입니다.

thinking 강제

이 정도 능력의 모델은 검토 없이 바로 답하면 안 된다는 선언입니다. 끄는 옵션을 아예 없앴습니다.

거부

안전 개입을 예외 상황이 아니라 정식 응답 종류로 만들었습니다. stop_reason과 과금 체계에 포함됩니다.

Opus 폴백

거부해도 전작이 이어받습니다. 능력의 세대 사다리를 그대로 안전의 사다리로 다시 씁니다.

이래서 좋습니다

강한 모델을 빨리 쓴다

위험한 부분만 따로 거르니까, 출시를 미루지 않고 능력은 그대로 내보냈습니다.

거부당해도 안 멈춘다

Opus 4.8이 이어받아 정상 응답으로 돌려줍니다. 그 위에 만든 서비스가 안 끊깁니다.

손해를 덜 본다

거부로 실패한 호출은 캐시 비용을 환불합니다.

안전 수준을 고른다

일반은 분류기가 켜진 Fable, 심사 통과자는 원본 Mythos를 씁니다.

이래서 문제입니다

개입이 안 보인다

받은 답이 Fable이 쓴 건지, 거부돼서 Opus가 대신 쓴 건지 알 수 없습니다.

멀쩡한 요청도 막힌다

"추론을 보여줘" 같은 흔한 프롬프트가 reasoning_extraction으로 거부될 수 있습니다.

안전판 버전 배분이 새 문제

떼어낸 Mythos를 누구에게 줄지가 권력 문제가 됩니다. 심사 기준은 비공개입니다.

비싸다

가격이 전작의 2배입니다. 단순 호출 용도면 부담이 큽니다.

장점과 단점이 같은 설계에서 나옵니다. 안전을 모델 밖으로 꺼냈기 때문에 강한 모델을 안 끊기게 쓸 수 있고, 바로 그 때문에 안전장치가 사용자 모르게 작동합니다. 편의와 투명성을 맞바꾼 모델입니다.

이 종합은 공식 발표의 사실들에서 끌어낸 해석입니다. Anthropic이 이 문장 그대로 밝힌 입장은 아닙니다.

Epilogue · Disposition

성능 수치 밖의 특징, 작업 성향입니다.

짧은 지시로 제어되지만, 내버려두면 서술이 길어집니다.

공식 문서가 설명하는 Fable 5의 작업 성향입니다. 며칠에 걸친 목표 지향 작업을 유지하고, 긴 지시 나열 없이 짧은 지시로 제어되고, subagent를 더 적극적으로 씁니다. 단점도 명시되어 있습니다. 조정하지 않으면 서술이 길어지고, 드물게 요청하지 않은 행동(이메일 초안, git 백업)을 하고, 긴 세션에서 일찍 멈추거나 불필요하게 허가를 구하는 경우가 보고됐습니다.

Strengths

멀티-데이 실행

[A]

며칠에 걸친 목표 지향 작업을 유지합니다. 지시를 오래 기억하고 따릅니다.

짧은 지시

[A]

제약을 길게 나열하지 않아도 대부분 제어됩니다.

위임과 병렬

[A]

subagent를 더 적극적으로 쓰고, 비동기 협업이 안정적입니다.

Cautions

과다 서술

[A]

조정하지 않으면 옵션 나열과 원인 설명이 길어지는 경향이 있습니다.

미요청 행동

[A]

드물게 요청하지 않은 이메일 초안 작성, git 백업 같은 행동이 보고됐습니다.

조기 종료

[A]

긴 세션에서 일찍 멈추거나 불필요하게 허가를 구하는 경우가 있습니다.

마지막으로 한 가지.

이 리포트의 리서치와 페이지 제작은 Fable 5로 작업했습니다.

위에 적힌 작업 성향은 실제 작업 과정에서도 비슷하게 나타났습니다.

Outro

확인된 것과, 아직 확인되지 않은 것

D+0

리서치 시점

$10/$50

가격 (in/out, MTok)

0.03%

안전 개입 트래픽

같은 날 나온 모델 수

Confirmed

[A]

출시일 2026-06-09 · 모델 ID claude-fable-5 · Opus 위 최상위 티어 신설

[A]

쌍둥이 claude-mythos-5 (안전 분류기 제거) · Project Glasswing 한정 공급

[A]

1M 컨텍스트 / 128K 출력 · adaptive thinking 강제 · 가격 $10/$50

[A]

refusal stop_reason + fallbacks 파라미터 · prompt cache 최소 512토큰

[A]

Stripe / Cognition / Pokémon 등 사례 기반 성능 주장

Unconfirmed

[B]

표준 벤치 정량 점수 다수: System Card 원문 미검증, 2차 매체 전사값

[C]

Reddit 실사용 후기: 도메인 차단으로 미확보

[C]

한국어권 심층 후기: 출시 익일이라 미생성 추정

[B]

레이턴시 / throughput 실측치: 정성 서술만 존재

[A]

토크나이저 증가율: 공식 문서 내 30% vs 35% 표기 불일치

출시 24시간 기준의 정리는 여기까지입니다. System Card 원문과 실사용 후기가 쌓이면 미확인 항목부터 업데이트가 필요합니다.