„Антропик“ оспори решението на САЩ да спре два нейни AI модела: Това може да блокира всички нови разработки

„Антропик“ оспори решението на САЩ да спре два нейни AI модела: Това може да блокира всички нови разработки

Изявление относно директивата на правителството на САЩ за спиране на достъпа до Fable 5 и Mythos 5

Правителството на САЩ, позовавайки се на органите за национална сигурност, издаде директива за контрол на износа, с която се спира всякакъв достъп до Fable 5 и Mythos 5 от всички чуждестранни граждани, независимо дали са в или извън Съединените щати, включително служители на Anthropic, които са чуждестранни граждани. Крайният ефект от тази заповед е, че трябва внезапно да деактивираме Fable 5 и Mythos 5 за всички наши клиенти, за да гарантираме спазването на правилата. Достъпът до всички други модели на Anthropic няма да бъде засегнат.

Получихме директивата от правителството днес в 17:21 ч. (ET). Писмото не предоставя конкретни подробности относно опасенията за националната сигурност. Разбираме, че правителството смята, че е разбрало за метод за заобикаляне или „джейлбрейк“ на Fable 5. Прегледахме демонстрация на тази специфична техника, използвана за идентифициране на малък брой предварително известни, незначителни уязвимости. Всички тези уязвимости изглеждат сравнително прости и открихме, че други публично достъпни модели също са в състояние да ги открият, без да е необходимо заобикаляне.

Позицията на Anthropic по отношение на предпазните мерки на Fable, както е посочено в публикацията ни в блога за пускането на продукта, е следната:

- Въведохме строги предпазни мерки, които значително намаляват вероятността Fable да бъде злоупотребен за задачи, свързани с киберсигурността (наред с други). Всъщност, нашите предпазни мерки са толкова силни, че много потребители се оплакват, че са прекалено широки.

- В седмиците преди старта на Fable, Anthropic работи с правителството на САЩ, британския AISI, множество частни организации на трети страни и вътрешни екипи, за да провери защитните мерки на Fable в продължение на хиляди часове.

- Тези тестове показаха, че защитните мерки на Fable са значително по-ефективни от тези на който и да е преди това внедрен модел.

- Все още никой тестер не е успял да намери универсален джейлбрейк – метод за джейлбрейк, който може много широко да заобиколи защитите на модела, деблокирайки широк спектър от кибер възможности.

- Подозираме, че перфектната устойчивост на джейлбрейк в момента не е възможна за нито един доставчик на модели. Всяка защитна мярка, използвана в индустрията, е уязвима към неуниверсални джейлбрейкове (които могат да извлекат известна киберинформация при специфични обстоятелства) и е вероятно универсални джейлбрейкове евентуално да бъдат открити в бъдеще. Заявихме това ясно, когато пуснахме Fable 5.

- Като се има предвид, че перфектната устойчивост на джейлбрейк изглежда невъзможна днес, Anthropic възприе стратегия за дълбоко задълбочена защита с Fable 5. Целта ни беше да направим джейлбрейковете или тесни (в случай на неуниверсални джейлбрейкове), или много скъпи за производство (в случай на универсални джейлбрейкове), и да комбинираме това с щателен мониторинг за бързо откриване и спиране на всякакви успешни атаки. Ето защо Anthropic изисква 30-дневно съхранение на клиентските данни с Fable – промяна в политиката, която носи реални разходи за нас с клиентите , но ни позволява да изследваме и смекчаваме джейлбрейковете.

- Ние подкрепяме тази стратегия за дълбоко задълбочена защита. Тя намалява рисковете, породени от Fable, правейки ги сравними с рисковете на съществуващите модели, вече внедрени в индустрията.

- Дори не получихме разкритие за обезпокоителен неуниверсален потенциален джейлбрейк, който да е довел до вреден резултат. Потенциалните джейлбрейкове, които ни бяха разкрити, са или изцяло безобидни реакции, или са незначителни открития, които не предоставят специфично за Mythos подобрение.

Към днешна дата правителството ни е предоставило само устни доказателства за потенциален тесен, неуниверсален джейлбрейк, който по същество се състои в това да се поиска от модела да прочете специфична кодова база и да поправи всички софтуерни недостатъци. Разбираме, че един потенциален джейлбрейк е бил споделен с правителството. Прегледахме доклад, който според нас е в основата на правителствената директива, и потвърдихме, че нивото на възможности, показано там, е широко достъпно от други модели (включително GPT-5.5 на OpenAI ) и се използва всеки ден от защитниците, които пазят системите в безопасност. Ще споделим повече подробности през следващите 24 часа.

Спазваме правната директива на правителството и премахваме достъпа до Fable 5 и Mythos 5 за всички потребители. Не сме съгласни обаче, че констатацията на тесен потенциал за джейлбрейк трябва да е причина за изтегляне на търговски модел, внедрен сред стотици милиони хора. Ако този стандарт се прилагаше в цялата индустрия, смятаме, че той по същество би спрял внедряването на всички нови модели за всички доставчици на гранични модели.

Както публично заявихме , ние вярваме , че правителството трябва да има възможността да блокира опасни внедрявания, като част от законоустановен процес, който е прозрачен, справедлив, ясен и основан на технически факти. Това действие не е в съответствие с тези принципи.

Извиняваме се на нашите клиенти за това неудобство. Смятаме, че това е недоразумение и работим за възстановяване на достъпа възможно най-скоро.

Източник: anthropic.com

 

 

Коментари