Ameryka zablokowała modele. Świat znalazł sposób.
12 czerwca rząd USA zablokował publiczny dostęp do najpotężniejszych modeli Anthropic — Claude Fable 5 i Claude Mythos 5. Dwa tygodnie później japońska Sakana AI pokazuje, jak to obejść. Jej system Fugu Ultra nie jest większym modelem. Jest mądrzejszym koordynatorem, który łączy dziesiątki modeli w jeden system — i pokonuje Fable 5 w testach kodowania. To nie anegdota o jednym produkcie. To dowód, że kontrola eksportu na oprogramowanie ma krótkie nogi.
Fugu: kiedy orkiestracja bije monolit
Sakana AI, startup z Tokio, udowodnił coś niewygodnego dla amerykańskich regulatorów. Gdy Waszyngton zablokował dostęp do Claude Fable 5 — najpotężniejszego modelu Anthropic — japońska firma stworzyła system, który osiąga to samo bez użycia tego modelu.
Fugu działa jak generalny wykonawca na budowie. Zamiast jednego super-specjalisty zatrudnia ekipę ekspertów — każdy dostaje zadanie, w którym jest najlepszy. Klient widzi jeden numer telefonu i dostaje gotowy projekt. To, co dzieje się za kulisami, to inteligentne zarządzanie podwykonawcami.
W testach programowania (LiveCodeBench) Fugu Ultra zdobył 93,2 punktu — więcej niż Claude Fable 5. W zadaniach inżynieryjnych (SWE-Bench Pro) osiągnął 73,7, wyprzedzając GPT-5.5 i Gemini 3.1 Pro.
Amerykańska blokada eksportowa ma poważną lukę. Jeśli można osiągnąć wyniki na poziomie zakazanego modelu, łącząc inne, legalnie dostępne modele — blokada ogranicza tylko jedną markę. Nie blokuje dostępu do inteligencji.
Sakana AI opisała Fugu jako system orkiestracji multi-agentowej, który dynamicznie kieruje zapytania do puli wymiennych modeli wyspecjalizowanych. Architektura opiera się na dwóch pracach badawczych z 2026 — TRINITY i Conductor — i uczy się strategii koordynacji zamiast używać ręcznie zaprojektowanych workflowów.
Na LiveCodeBench Fugu Ultra: 93,2 pkt, Fugu: 92,9 pkt. Na SWE-Bench Pro Fugu Ultra: 73,7 — przed Claude Opus 4.8 (69,2), GPT-5.5 (58,6), Gemini 3.1 Pro (54,2).
Strategicznie: Fugu to odpowiedź na vendor lock-in i export controls. Kiedy rząd USA zablokował Fable 5 i Mythos 5, firmy i państwa straciły dostęp do SOTA overnight. Pula agentów w Fugu jest wymienna — pojedynczy dostawca nie jest single point of failure.
CEO Sakany David Ha (były Google Brain) określił to wprost: poleganie na modelu jednej firmy dla narodowej infrastruktury to ogromne ryzyko. Orkiestracja to hedging.
GPT-5 Pro rozwiązał zagadkę, która męczyła naukowców trzy lata
Derya Unutmaz, immunolog z Jackson Laboratory, przeprowadził w 2022 roku eksperyment, którego wyników nie potrafił wyjaśnić przez trzy lata. Testował, jak cukier (glukoza) wpływa na rozwój limfocytów T — komórek odpornościowych, które organizm używa do walki z rakiem i infekcjami.
Eksperyment dał dziwny wynik. Komórki traktowane związkiem blokującym glukozę zachowywały się inaczej niż komórki w środowisku z małą ilością glukozy. Logika mówiła, że powinny reagować podobnie. Zespół Unutmaza nie miał wyjaśnienia, więc odłożył temat.
Pod koniec 2025 roku Unutmaz wrzucił dane do GPT-5 Pro. Model połączył fakty, których immunolog sam nie widział: związek blokujący glukozę zakłóca produkcję białka IL-2, a to białko powstrzymuje limfocyty T przed przekształceniem w komórki zapalne.
To jak konsultacja z kolegą z innej specjalizacji, który łączy kropki, których nie widzisz, bo jesteś zbyt blisko swojego tematu. Różnica: ten kolega przetworzył setki artykułów naukowych i odpowiedział w kilka minut.
Unutmaz poprosił model o przewidzenie wyniku kolejnego eksperymentu — testu limfocytów T na chłoniaku. GPT-5 Pro przewidział poprawnie, mimo że wynik nie był nigdzie opublikowany.
Eksperyment z 2022: limfocyty T eksponowane na deoksyglukozę (analog glukozy blokujący jej metabolizm) masowo diferencjonowały w kierunku Th17, podczas gdy limfocyty w środowisku niskoglukozowym robiły to w znacznie mniejszym stopniu. Różnica nie wynikała z samego deficytu energetycznego.
GPT-5 Pro połączył to z mechanizmem: deoksyglukoza zakłóca syntezę IL-2. IL-2 hamuje diferencjację w kierunku Th17. Usunięcie tej bariery oznacza nadmierną produkcję Th17. Implikacje dla immunoterapii nowotworów i chorób autoimmunologicznych.
Kluczowy moment: Unutmaz poprosił GPT-5 Pro o symulację eksperymentu na CD8+ (limfocyty cytotoksyczne celujące w chłoniaka). Model poprawnie przewidział wzrost zdolności do zabijania komórek nowotworowych — bez opublikowanych wcześniej wyników.
Unutmaz używa teraz GPT-5.2 Deep Research i Codex do kompilacji datasetów mutacji nowotworowych i szkicu podręcznika immunologii komórkowej.
Claude zamieszka w Slacku i będzie czytał Twoje rozmowy
Anthropic uruchomił Claude Tag — funkcję, która zamienia bota w Slacku na stałego członka zespołu. Zamiast oznaczać Claude'a tylko gdy potrzebujesz odpowiedzi, nowa wersja śledzi rozmowy na kanale, uczy się kontekstu firmy i sama zagląda do dyskusji, gdy ma coś do dodania.
To jak nowy pracownik, który przez pierwsze tygodnie cicho siedzi na spotkaniach, słucha, notuje — a potem zaczyna proponować rozwiązania, bo rozumie, jak firma działa. Różnica: ten pracownik przetwarza setki wątków jednocześnie i nie zapomina niczego.
Administrator ustala, do czego Claude ma dostęp. Każda tożsamość Claude'a jest przypisana do konkretnych kanałów — wersja dla działu prawnego nie widzi rozmów inżynierów. Zadania można przydzielać wprost (@Claude, zrób X) lub pozwolić botowi działać proaktywnie w trybie ambientowym.
Anthropic zbiera tu to, co Microsoft próbuje zrobić z Copilotem — kontekst organizacyjny. Kto pierwszy zbuduje warstwę „zna Twoją firmę", ten zdominuje rynek enterprise AI.
Claude Tag (beta dla Enterprise i Team) dodaje warstwę trwałego kontekstu i pamięci ponad istniejące integracje (DM @Claude, Claude Code in Slack). Wcześniejsze wersje działały point-in-time — Claude Tag utrzymuje ciągłość.
Dwie funkcje: (1) task mode — Claude rozkłada zadanie na etapy, pracuje z narzędziami, raportuje w threadzie; (2) ambient mode — proaktywnie flaguje zapomniane wątki i łączy informacje między kanałami, jeśli ma uprawnienia.
Architektura uprawnień: sysadmin definiuje tools/data/channel access. Claude per-channel, scoped. Legal Claude ≠ engineering Claude. Każdy widzi historię i kontynuuje pracę poprzedniego rozmówcy.
Kontekst enterprise to battlefield: Microsoft Graph + Copilot, Snowflake/Databricks jako backend, Glean jako intelligence layer. Anthropic gra kartą native Slack integration + persistent memory.
NVIDIA i AWS: nowe chipy, 10x szybsze wyszukiwanie
NVIDIA i Amazon Web Services ogłosili pakiet zmian o jednym celu: tańsze i szybsze wdrażanie AI w skali produkcyjnej.
Pierwszy element: nowe serwery w chmurze AWS (instancje G7) z najnowszymi procesorami graficznymi NVIDIA Blackwell. Według NVIDII do 4,6 raza szybsze we wnioskowaniu AI niż poprzednicy.
Drugi: wyszukiwanie wektorowe w Amazon OpenSearch — technologia, którą systemy AI używają do przeszukiwania ogromnych baz danych — jest teraz domyślnie akcelerowane przez chipy NVIDIA. Wynik: indeksowanie do 10 razy szybsze przy jednej czwartej kosztów.
Trzeci: AWS dostał status „Exemplar Cloud" dla treningu na procesorach NVIDIA GB300 — gwarancję wydajności zgodnej z architekturą referencyjną.
Budowa systemu AI, który przeszukuje miliard dokumentów w mniej niż godzinę, przestaje być projektem badawczym. Staje się standardową funkcją chmury.
Trzy komponenty:
1. EC2 G7 instances: NVIDIA RTX PRO 4500 Blackwell Server Edition. Do 8 GPU/instancję, 256 GB VRAM, 700 Gbps EFA networking, do 7,6 TB NVMe. vs G6: 4,6x inference, 2,1x graphics. Dostępne przez DL AMIs, DLC, EMR, EKS, ECS.
2. NVIDIA cuVS jako default vector indexing w OpenSearch Serverless. GPU-accelerated: 10x szybsze, 25% kosztów vs CPU. Billion-scale vector DB w poniżej godziny.
3. AWS = NVIDIA Exemplar Cloud dla GB300 training — spełnia benchmarki referencyjne NVIDIA.
RAG i agentic AI w produkcji potrzebują low-latency inference + fast vector search + scalable infra. To jest full-stack odpowiedź na te trzy potrzeby.
Mistral OCR 4 i krótkie fuchy
Mistral AI wydał OCR 4 — system rozpoznawania tekstu, który nie tylko wyciąga tekst z dokumentów, ale zwraca go w ustrukturyzowanej formie. Każdy element (akapit, tabela, nagłówek) dostaje współrzędne, klasyfikację i ocenę pewności. Obsługuje 170 języków i działa w jednym kontenerze na Twoim serwerze.
To jak asystent, który czyta dokument i mówi „to jest tabela, to jest nagłówek, a tego fragmentu nie jestem pewien." Dokumenty gotowe do przetwarzania przez systemy AI — z cytowaniami i odniesieniami do źródła.
Mistral OCR 4: structured output z bounding boxami, typed classification, per-page i per-word confidence scores. 170 języków, self-hosted (single container). Input gotowy do RAG/agentic pipelines przez jedno API.
Drobne: Datalab wydał lift — 9B open-weights model wizyjny ekstraktujący ustrukturyzowany JSON z PDF wg schema. Schema-constrained decoding, trained abstention (null zamiast halucynacji). 90,2% field accuracy na benchmarku 225 dokumentów.
Prime Intellect wydał prime-rl 0.6.0 — framework do asynchronicznego reinforcement learning na modelach MoE z bilionem parametrów. Trenował GLM-5 na zadaniach SWE z kontekstem do 131k tokenów, sub-5-minutowymi krokami, na 28 węzłach H200.
Co mówią twórcy
Nate B. Jones — "You Can't Tell If I'm Real Anymore" ↗
- Klonowanie głosu działa wystarczająco dobrze, by oszukać przypadkowego widza — próg nie jest w doskonałości, lecz w środowiskach niskiej uwagi
- „Czy to zrobione przez AI?" to naprawdę pięć różnych pytań zgniecionych w jedno (syntetyczny głos? twarz? skrypt? pomysł? aprobata człowieka?)
- Zasobem deficytowym nie jest treść ani poler — jest zaufanie. AI produkuje nieskończoną ilość dopracowanej treści, więc rozsądek i odpowiedzialność stają się nową walutą
Aniket Panjwani — "Why Your Codex Goals Suck" ↗
- Klucz do dobrych celów w Codexie: weryfikowalne kryteria sukcesu — nie opis tego, co chcesz, ale definicja tego, jak agent ma sprawdzić, że się udało
- Demo: konwersja pakietu ekonometrycznego Python/Stata na R — istniejące implementacje w dwóch językach stały się wyrocznią parzystości dla trzeciego
- Czas człowieka idzie w projektowanie kontraktu z góry i review z dołu. 14-godzinny run nocny robi resztę
Simon Scrapes — "Claude Code Just Hit A Different Level" ↗
- Rzeczna umiejętność w pracy z Claude Code to nie „zbuduj wszystko" — to decyzja build-vs-buy na każdym poziomie dekompozycji problemu
- Pamięć Claude Code out-of-box jest słaba — custom system z source citation, short-term active context i semantic long-term search rozwiązuje problem
- Koszty utrzymania to ukryty podatek: wąski scope (jeden workflow, nie 20-funkcyjny CRM) zapobiega transformacji build w pasztet
Itssssss Jack — "This OpenSource Repo will 10X Your Hermes Agent" ↗
- Agent Reach (32k+ gwiazdek na GitHub) daje agentom ustrukturyzowany dostęp do YouTube, GitHub, RSS, Reddita i X — zwraca czysty tekst zamiast HTML, tnąc koszty tokenów o 60–70%
- Stack Agent Reach + Clay + Grok API zamienia Claude/Hermesa w system researchowy go-to-market — od „znajdź 6 kontaktów w OpenAI" do personalizowanego outreach ze zweryfikowanymi mailami
Koncentrat
Dwa tygodnie temu Ameryka zablokowała swoje najlepsze modele AI dla reszty świata. Tydzień później Japonia pokazała, jak to obejść. W tym samym tygodniu OpenAI udowodniło, że AI potrafi rozwiązywać zagadki naukowe, na których ludzie utknęli na lata. Anthropic wbudował swojego asystenta w miejsce, gdzie i tak pracujesz. NVIDIA i AWS obniżyli koszty infrastruktury.
Wzór dnia: inteligencja przestaje być monopolem jednej firmy, jednego kraju, jednego modelu. Kto pierwszy zbuduje warstwę orkiestracji — ten wygra.
Wzór dnia: orkiestracja ponad monolit. Sakana Fugu udowadnia, że zespół wymiennych agentów z odpowiednią koordynacją osiąga frontier performance bez dostępu do zakazanych modeli. W tym samym oknie: GPT-5 Pro jako narzędzie naukowe (symulacja eksperymentów, łączenie literatury), Claude Tag jako warstwa kontekstowa enterprise, NVIDIA+AWS jako commodity infra, Mistral OCR 4 jako structured extraction.
Rynek przesuwa się od „który model jest najlepszy" do „który system orkiestracji jest najlepszy." To zmienia kalkulację strategiczną: nie dostawca modelu jest ryzykiem, lecz brak warstwy abstrakcji nad dostawcami.
Poleganie na modelu jednej firmy dla narodowej infrastruktury to ogromne ryzyko. Kolektywna inteligencja to praktyczne zabezpieczenie.
— David Ha, CEO Sakana AI