Правительство США приказывает Anthropic приостановить два ведущих ИИ-модели из-за проблем с безопасностью
Anthropic отключила модели Claude Fable 5 и Claude Mythos 5 по всему миру после указания США о рисках для национальной безопасности, хотя компания оспаривает обоснованность решения.
Правительство Соединённых Штатов в пятницу приказало Anthropic заблокировать доступ к двум своим самым продвинутым ИИ-системам — Claude Fable 5 и Claude Mythos 5, сославшись на опасения, что модели могут быть использованы в целях, представляющих угрозу национальной безопасности. Anthropic подтвердила в своём аккаунте X, что выполнила указание, но фирма утверждает, что действие необоснованно.
Приказ, полученный в 17:21 по восточному времени, требует от компании отключить обе модели для всех пользователей по всему миру, а не только для иностранных граждан, как подразумевается в формулировке экспортного контроля. Другие модели Anthropic остаются доступными.
Claude Mythos 5, которую компания описывает как свою наиболее способную модель, изначально была выпущена ограниченной группе из примерно 50 проверенных организаций в рамках программы под названием Project Glasswing. Anthropic заявила, что модель может выявлять уязвимости в программном обеспечении и предназначалась для оборонительных задач в кибербезопасности.
Claude Fable 5, запущенная три дня ранее, представляет собой версию Mythos 5 с дополнительными ограничениями, направленными на блокировку тем высокого риска, таких как кибербезопасность и биология, что делает её пригодной для более широкого коммерческого использования. Независимые бенчмарки отметили её как самую способную публично доступную ИИ-модель на момент выпуска.
В блоге Anthropic указано, что обеспокоенность правительства сосредоточена на сообщённом «узком, неуниверсальном взломе», который якобы позволяет модели читать кодовую базу и указывать на программные дефекты. Компания говорит, что правительство предоставило лишь устные доказательства этой проблемы и отмечает, что аналогичные возможности существуют в других публично доступных моделях, включая GPT-5.5 от OpenAI.
«Мы не согласны с тем, что обнаружение узкого потенциального взлома должно стать поводом для отзыва коммерческой модели, развернутой у сотен миллионов людей», — написала компания.
Anthropic добавила, что её механизмы безопасности опираются на независимые классификаторы, работающие отдельно от модели, поэтому даже если пользователь обходит отказ, базовая защита от опасных выводов остаётся активной.
Это указание поступает в тот момент, когда Anthropic готовится к потенциальному первичному публичному размещению акций позже в этом году и позиционирует себя как ориентированную на безопасность альтернативу конкурентам-разработчикам ИИ.