미국 정부가 AI 모델 하나를 껐다가 18일 만에 켠 일 (Fable 5)

AI 규제 얘기는 보통 추상적이야. “언젠가 정부가 개입할 수도 있다” 같은. 그런데 2026년 6월, 그 “언젠가”가 실제로 벌어졌어. 미국 정부가 상용 AI 모델 하나의 접근을 당일 오후에 막아버렸거든.

그리고 18일 뒤에 다시 풀었어. 짧지만 이 사건은 앞으로 반복될 그림의 첫 판본처럼 보여서, 무슨 일이었는지 정리해둘 만해.

무슨 일 — 시간순으로 보면

당사자는 Anthropic이라는 AI 회사(Claude를 만드는 곳)야. 문제가 된 모델은 최신 모델인 Fable 5와, 안전장치를 덜 걸어 소수 파트너에게만 준 자매 모델 Mythos 5.

시간순은 이래.

6월 9일 — Fable 5, Mythos 5 출시.
6월 12일 오후 5시 21분(미 동부시간) — 미국 정부가 국가안보를 근거로 수출통제 지시를 내림. “외국 국적자는 미국 안이든 밖이든 이 두 모델에 접근 못 하게 하라”는 내용. 실시간으로 국적을 가릴 방법이 없으니 Anthropic은 모든 사용자에게 두 모델을 끔.
6월 26일 — 정부가 미국 일부 기관에 대해 Mythos 5 접근을 승인.
6월 30일 — 수출통제 해제. Fable 5는 7월 1일부터 전 세계 재개.

발단은 “탈옥(jailbreak)“이었어. AI 모델에는 위험한 요청을 막는 안전장치가 걸려 있는데, 이걸 우회하는 프롬프트 기법을 탈옥이라고 불러. 정부는 Amazon 연구자들이 Fable 5의 안전장치를 우회해 소프트웨어 취약점을 찾아내게 만든 사례 보고를 받고 움직인 거야.

왜 중요한가

이건 단순한 서비스 장애가 아니야. 정부가 이미 출시된 상용 AI 모델을, 통상적인 절차 없이, 즉시 내리게 만든 첫 급 사례에 가까워. 수억 명이 쓰는 제품을 하루아침에 끌 수 있다는 게 증명된 거지.

그리고 이 사건이 남긴 건 껐다 켠 것 자체가 아니라 그 뒤에 만들어진 규칙들이야. Anthropic은 재개하면서 Amazon·Microsoft·Google 등과 함께 “탈옥의 심각도를 점수 매기는 산업 공통 틀”을 제안했고, 미국 정부와의 사전 검증·정보 공유 협력을 강화하겠다고 했어. 즉 한 번의 충돌이 “다음부터는 이렇게 하자”는 프레임워크로 굳어지는 중이야.

확인된 것과 각자가 주장하는 것

이 사건은 정부와 회사가 같은 사실을 두고 다르게 프레이밍한 전형이라, 갈라 보는 게 특히 중요해.

정부 측 프레이밍(추정). 국가안보 위협. 다만 6월 12일 지시서에는 구체적 근거가 적혀 있지 않았고, Anthropic 말로는 초기엔 “구두 증거”만 받았대.

Anthropic 측 주장. 문제의 기법으로 찾아낸 건 “이미 알려진, 사소한 취약점 몇 개”였고, 다른 공개 모델들도 우회 없이 같은 걸 찾아낸다는 거야. 재개 발표에서 회사는 검증 결과를 더 구체적으로 내놨어 — 같은 취약점을 Opus 4.8, GPT-5.5, Kimi K2.7 등도 식별했고, 취약점 악용 시연은 테스트한 모든 모델(Haiku 4.5, Sonnet 4.6, 여러 Opus 버전, GPT-5.4/5.5, Kimi K2.7 포함)이 재현했다고.

여기서 확인되는 것. 두 발표문이 공통으로 인정하는 사실이 하나 있어: 문제의 능력은 Fable 5만의 고유 위험이 아니었다는 점. 상무부 산하 CAISI라는 정부 기관조차 새 안전장치를 테스트하고 “매우 강력하다”고 동의했다고 재개 발표는 적어. 즉 “위험이 있었다 vs 없었다”의 문제라기보다, 어느 정도의 위험에 어떤 절차로 대응하느냐를 두고 갈린 사건이야.

Anthropic이 대놓고 반대한 지점. 회사는 이렇게 못박았어.

“좁은 잠재적 탈옥 하나를 발견한 것이, 수억 명에게 배포된 상용 모델을 회수할 근거가 돼선 안 된다고 본다. 이 기준을 업계 전체에 적용하면 모든 프론티어 모델 배포가 사실상 멈출 것이다.”

동시에 회사는 “정부가 안전하지 않은 배포를 막을 권한 자체는 있어야 한다”고도 했어. 반대하는 건 권한이 아니라 절차의 불투명함이라는 거지. 이건 회사 입장이라 그대로 채택할 얘긴 아니지만, 발표문이 스스로 그은 선이 어디인지는 알아둘 만해.

아직 모르는 것

정부가 실제로 본 증거가 뭐였는지는 공개되지 않았어. 우리가 아는 건 양쪽 발표문뿐이고, 그중 한쪽은 당사자야.
이번에 제안된 “탈옥 심각도 채점 틀”이 실제 업계 표준으로 자리 잡을지, 아니면 이 회사들만의 자율 규약에 그칠지.

다음에 볼 것

다른 정부·다른 회사에서 같은 일이 반복되는가. 반복되면 “AI 배포에 정부 사전 검증”이 관행으로 굳는 신호야.
제안된 프레임워크의 실물. Anthropic은 탈옥을 네 기준(능력 향상 폭·적용 범위·무기화 난이도·발견 용이성)으로 점수 매기자고 했어. 이게 실제 문서로 나오고 다른 사업자가 서명하는지.
한국 등 “외국 국적자”에게 미치는 실무 영향. 이번엔 국적 기반 차단이 실시간 검증 불가로 전면 중단이 됐지만, 앞으로 비슷한 지시가 나오면 지역·국적별로 서비스가 갈릴 수 있어.

규제가 추상에서 실무로 내려오는 순간이 어떤 모습인지, 이 18일이 한 장의 스냅샷을 남겼어.

🥚

Explorer

Recent Notes

Amazon

Anthropic

2026년 7월 4일 — NVIDIA 816억 달러를 어떻게 읽나, 그리고 원화 약세의 진짜 주어

NVIDIA의 다음 분기는 칩 경쟁력이 아니라 하이퍼스케일러 capex가 결정한다