NA ŻYWO
Ameryka zablokowała modele. Świat znalazł sposób. OpenAI chce zabezpieczyć cały internet. Ma na to model. Co to jest SLM? Small Language Model — mały, ale zdolny Co to jest open source AI? Modele AI dostępne dla każdego Co to jest Ollama? Uruchom modele AI na swoim komputerze Co to jest destylacja modeli AI? Mniejszy model, porównywalna jakość
CYTRYNA.AI

Ameryka zablokowała modele. Świat znalazł sposób.

Esencja

    12 czerwca rząd USA zablokował publiczny dostęp do najpotężniejszych modeli Anthropic — Claude Fable 5 i Claude Mythos 5. Dwa tygodnie później japońska Sakana AI pokazuje, jak to obejść. Jej system Fugu Ultra nie jest większym modelem. Jest mądrzejszym koordynatorem, który łączy dziesiątki modeli w jeden system — i pokonuje Fable 5 w testach kodowania. To nie anegdota o jednym produkcie. To dowód, że kontrola eksportu na oprogramowanie ma krótkie nogi.

    Fugu: kiedy orkiestracja bije monolit

    Sakana AI, startup z Tokio, udowodnił coś niewygodnego dla amerykańskich regulatorów. Gdy Waszyngton zablokował dostęp do Claude Fable 5 — najpotężniejszego modelu Anthropic — japońska firma stworzyła system, który osiąga to samo bez użycia tego modelu.

    Fugu działa jak generalny wykonawca na budowie. Zamiast jednego super-specjalisty zatrudnia ekipę ekspertów — każdy dostaje zadanie, w którym jest najlepszy. Klient widzi jeden numer telefonu i dostaje gotowy projekt. To, co dzieje się za kulisami, to inteligentne zarządzanie podwykonawcami.

    W testach programowania (LiveCodeBench) Fugu Ultra zdobył 93,2 punktu — więcej niż Claude Fable 5. W zadaniach inżynieryjnych (SWE-Bench Pro) osiągnął 73,7, wyprzedzając GPT-5.5 i Gemini 3.1 Pro.

    Amerykańska blokada eksportowa ma poważną lukę. Jeśli można osiągnąć wyniki na poziomie zakazanego modelu, łącząc inne, legalnie dostępne modele — blokada ogranicza tylko jedną markę. Nie blokuje dostępu do inteligencji.

    Sakana AI opisała Fugu jako system orkiestracji multi-agentowej, który dynamicznie kieruje zapytania do puli wymiennych modeli wyspecjalizowanych. Architektura opiera się na dwóch pracach badawczych z 2026 — TRINITY i Conductor — i uczy się strategii koordynacji zamiast używać ręcznie zaprojektowanych workflowów.

    Na LiveCodeBench Fugu Ultra: 93,2 pkt, Fugu: 92,9 pkt. Na SWE-Bench Pro Fugu Ultra: 73,7 — przed Claude Opus 4.8 (69,2), GPT-5.5 (58,6), Gemini 3.1 Pro (54,2).

    Strategicznie: Fugu to odpowiedź na vendor lock-in i export controls. Kiedy rząd USA zablokował Fable 5 i Mythos 5, firmy i państwa straciły dostęp do SOTA overnight. Pula agentów w Fugu jest wymienna — pojedynczy dostawca nie jest single point of failure.

    CEO Sakany David Ha (były Google Brain) określił to wprost: poleganie na modelu jednej firmy dla narodowej infrastruktury to ogromne ryzyko. Orkiestracja to hedging.

    GPT-5 Pro rozwiązał zagadkę, która męczyła naukowców trzy lata

    Derya Unutmaz, immunolog z Jackson Laboratory, przeprowadził w 2022 roku eksperyment, którego wyników nie potrafił wyjaśnić przez trzy lata. Testował, jak cukier (glukoza) wpływa na rozwój limfocytów T — komórek odpornościowych, które organizm używa do walki z rakiem i infekcjami.

    Eksperyment dał dziwny wynik. Komórki traktowane związkiem blokującym glukozę zachowywały się inaczej niż komórki w środowisku z małą ilością glukozy. Logika mówiła, że powinny reagować podobnie. Zespół Unutmaza nie miał wyjaśnienia, więc odłożył temat.

    Pod koniec 2025 roku Unutmaz wrzucił dane do GPT-5 Pro. Model połączył fakty, których immunolog sam nie widział: związek blokujący glukozę zakłóca produkcję białka IL-2, a to białko powstrzymuje limfocyty T przed przekształceniem w komórki zapalne.

    To jak konsultacja z kolegą z innej specjalizacji, który łączy kropki, których nie widzisz, bo jesteś zbyt blisko swojego tematu. Różnica: ten kolega przetworzył setki artykułów naukowych i odpowiedział w kilka minut.

    Unutmaz poprosił model o przewidzenie wyniku kolejnego eksperymentu — testu limfocytów T na chłoniaku. GPT-5 Pro przewidział poprawnie, mimo że wynik nie był nigdzie opublikowany.

    Eksperyment z 2022: limfocyty T eksponowane na deoksyglukozę (analog glukozy blokujący jej metabolizm) masowo diferencjonowały w kierunku Th17, podczas gdy limfocyty w środowisku niskoglukozowym robiły to w znacznie mniejszym stopniu. Różnica nie wynikała z samego deficytu energetycznego.

    GPT-5 Pro połączył to z mechanizmem: deoksyglukoza zakłóca syntezę IL-2. IL-2 hamuje diferencjację w kierunku Th17. Usunięcie tej bariery oznacza nadmierną produkcję Th17. Implikacje dla immunoterapii nowotworów i chorób autoimmunologicznych.

    Kluczowy moment: Unutmaz poprosił GPT-5 Pro o symulację eksperymentu na CD8+ (limfocyty cytotoksyczne celujące w chłoniaka). Model poprawnie przewidział wzrost zdolności do zabijania komórek nowotworowych — bez opublikowanych wcześniej wyników.

    Unutmaz używa teraz GPT-5.2 Deep Research i Codex do kompilacji datasetów mutacji nowotworowych i szkicu podręcznika immunologii komórkowej.

    Claude zamieszka w Slacku i będzie czytał Twoje rozmowy

    Anthropic uruchomił Claude Tag — funkcję, która zamienia bota w Slacku na stałego członka zespołu. Zamiast oznaczać Claude'a tylko gdy potrzebujesz odpowiedzi, nowa wersja śledzi rozmowy na kanale, uczy się kontekstu firmy i sama zagląda do dyskusji, gdy ma coś do dodania.

    To jak nowy pracownik, który przez pierwsze tygodnie cicho siedzi na spotkaniach, słucha, notuje — a potem zaczyna proponować rozwiązania, bo rozumie, jak firma działa. Różnica: ten pracownik przetwarza setki wątków jednocześnie i nie zapomina niczego.

    Administrator ustala, do czego Claude ma dostęp. Każda tożsamość Claude'a jest przypisana do konkretnych kanałów — wersja dla działu prawnego nie widzi rozmów inżynierów. Zadania można przydzielać wprost (@Claude, zrób X) lub pozwolić botowi działać proaktywnie w trybie ambientowym.

    Anthropic zbiera tu to, co Microsoft próbuje zrobić z Copilotem — kontekst organizacyjny. Kto pierwszy zbuduje warstwę „zna Twoją firmę", ten zdominuje rynek enterprise AI.

    Claude Tag (beta dla Enterprise i Team) dodaje warstwę trwałego kontekstu i pamięci ponad istniejące integracje (DM @Claude, Claude Code in Slack). Wcześniejsze wersje działały point-in-time — Claude Tag utrzymuje ciągłość.

    Dwie funkcje: (1) task mode — Claude rozkłada zadanie na etapy, pracuje z narzędziami, raportuje w threadzie; (2) ambient mode — proaktywnie flaguje zapomniane wątki i łączy informacje między kanałami, jeśli ma uprawnienia.

    Architektura uprawnień: sysadmin definiuje tools/data/channel access. Claude per-channel, scoped. Legal Claude ≠ engineering Claude. Każdy widzi historię i kontynuuje pracę poprzedniego rozmówcy.

    Kontekst enterprise to battlefield: Microsoft Graph + Copilot, Snowflake/Databricks jako backend, Glean jako intelligence layer. Anthropic gra kartą native Slack integration + persistent memory.

    NVIDIA i AWS: nowe chipy, 10x szybsze wyszukiwanie

    NVIDIA i Amazon Web Services ogłosili pakiet zmian o jednym celu: tańsze i szybsze wdrażanie AI w skali produkcyjnej.

    Pierwszy element: nowe serwery w chmurze AWS (instancje G7) z najnowszymi procesorami graficznymi NVIDIA Blackwell. Według NVIDII do 4,6 raza szybsze we wnioskowaniu AI niż poprzednicy.

    Drugi: wyszukiwanie wektorowe w Amazon OpenSearch — technologia, którą systemy AI używają do przeszukiwania ogromnych baz danych — jest teraz domyślnie akcelerowane przez chipy NVIDIA. Wynik: indeksowanie do 10 razy szybsze przy jednej czwartej kosztów.

    Trzeci: AWS dostał status „Exemplar Cloud" dla treningu na procesorach NVIDIA GB300 — gwarancję wydajności zgodnej z architekturą referencyjną.

    Budowa systemu AI, który przeszukuje miliard dokumentów w mniej niż godzinę, przestaje być projektem badawczym. Staje się standardową funkcją chmury.

    Trzy komponenty:

    1. EC2 G7 instances: NVIDIA RTX PRO 4500 Blackwell Server Edition. Do 8 GPU/instancję, 256 GB VRAM, 700 Gbps EFA networking, do 7,6 TB NVMe. vs G6: 4,6x inference, 2,1x graphics. Dostępne przez DL AMIs, DLC, EMR, EKS, ECS.

    2. NVIDIA cuVS jako default vector indexing w OpenSearch Serverless. GPU-accelerated: 10x szybsze, 25% kosztów vs CPU. Billion-scale vector DB w poniżej godziny.

    3. AWS = NVIDIA Exemplar Cloud dla GB300 training — spełnia benchmarki referencyjne NVIDIA.

    RAG i agentic AI w produkcji potrzebują low-latency inference + fast vector search + scalable infra. To jest full-stack odpowiedź na te trzy potrzeby.

    Mistral OCR 4 i krótkie fuchy

    Mistral AI wydał OCR 4 — system rozpoznawania tekstu, który nie tylko wyciąga tekst z dokumentów, ale zwraca go w ustrukturyzowanej formie. Każdy element (akapit, tabela, nagłówek) dostaje współrzędne, klasyfikację i ocenę pewności. Obsługuje 170 języków i działa w jednym kontenerze na Twoim serwerze.

    To jak asystent, który czyta dokument i mówi „to jest tabela, to jest nagłówek, a tego fragmentu nie jestem pewien." Dokumenty gotowe do przetwarzania przez systemy AI — z cytowaniami i odniesieniami do źródła.

    Mistral OCR 4: structured output z bounding boxami, typed classification, per-page i per-word confidence scores. 170 języków, self-hosted (single container). Input gotowy do RAG/agentic pipelines przez jedno API.

    Drobne: Datalab wydał lift — 9B open-weights model wizyjny ekstraktujący ustrukturyzowany JSON z PDF wg schema. Schema-constrained decoding, trained abstention (null zamiast halucynacji). 90,2% field accuracy na benchmarku 225 dokumentów.

    Prime Intellect wydał prime-rl 0.6.0 — framework do asynchronicznego reinforcement learning na modelach MoE z bilionem parametrów. Trenował GLM-5 na zadaniach SWE z kontekstem do 131k tokenów, sub-5-minutowymi krokami, na 28 węzłach H200.

    Co mówią twórcy

    Nate B. Jones — "You Can't Tell If I'm Real Anymore"

    • Klonowanie głosu działa wystarczająco dobrze, by oszukać przypadkowego widza — próg nie jest w doskonałości, lecz w środowiskach niskiej uwagi
    • „Czy to zrobione przez AI?" to naprawdę pięć różnych pytań zgniecionych w jedno (syntetyczny głos? twarz? skrypt? pomysł? aprobata człowieka?)
    • Zasobem deficytowym nie jest treść ani poler — jest zaufanie. AI produkuje nieskończoną ilość dopracowanej treści, więc rozsądek i odpowiedzialność stają się nową walutą

    Aniket Panjwani — "Why Your Codex Goals Suck"

    • Klucz do dobrych celów w Codexie: weryfikowalne kryteria sukcesu — nie opis tego, co chcesz, ale definicja tego, jak agent ma sprawdzić, że się udało
    • Demo: konwersja pakietu ekonometrycznego Python/Stata na R — istniejące implementacje w dwóch językach stały się wyrocznią parzystości dla trzeciego
    • Czas człowieka idzie w projektowanie kontraktu z góry i review z dołu. 14-godzinny run nocny robi resztę

    Simon Scrapes — "Claude Code Just Hit A Different Level"

    • Rzeczna umiejętność w pracy z Claude Code to nie „zbuduj wszystko" — to decyzja build-vs-buy na każdym poziomie dekompozycji problemu
    • Pamięć Claude Code out-of-box jest słaba — custom system z source citation, short-term active context i semantic long-term search rozwiązuje problem
    • Koszty utrzymania to ukryty podatek: wąski scope (jeden workflow, nie 20-funkcyjny CRM) zapobiega transformacji build w pasztet

    Itssssss Jack — "This OpenSource Repo will 10X Your Hermes Agent"

    • Agent Reach (32k+ gwiazdek na GitHub) daje agentom ustrukturyzowany dostęp do YouTube, GitHub, RSS, Reddita i X — zwraca czysty tekst zamiast HTML, tnąc koszty tokenów o 60–70%
    • Stack Agent Reach + Clay + Grok API zamienia Claude/Hermesa w system researchowy go-to-market — od „znajdź 6 kontaktów w OpenAI" do personalizowanego outreach ze zweryfikowanymi mailami

    Koncentrat

    Dwa tygodnie temu Ameryka zablokowała swoje najlepsze modele AI dla reszty świata. Tydzień później Japonia pokazała, jak to obejść. W tym samym tygodniu OpenAI udowodniło, że AI potrafi rozwiązywać zagadki naukowe, na których ludzie utknęli na lata. Anthropic wbudował swojego asystenta w miejsce, gdzie i tak pracujesz. NVIDIA i AWS obniżyli koszty infrastruktury.

    Wzór dnia: inteligencja przestaje być monopolem jednej firmy, jednego kraju, jednego modelu. Kto pierwszy zbuduje warstwę orkiestracji — ten wygra.

    Wzór dnia: orkiestracja ponad monolit. Sakana Fugu udowadnia, że zespół wymiennych agentów z odpowiednią koordynacją osiąga frontier performance bez dostępu do zakazanych modeli. W tym samym oknie: GPT-5 Pro jako narzędzie naukowe (symulacja eksperymentów, łączenie literatury), Claude Tag jako warstwa kontekstowa enterprise, NVIDIA+AWS jako commodity infra, Mistral OCR 4 jako structured extraction.

    Rynek przesuwa się od „który model jest najlepszy" do „który system orkiestracji jest najlepszy." To zmienia kalkulację strategiczną: nie dostawca modelu jest ryzykiem, lecz brak warstwy abstrakcji nad dostawcami.

    Poleganie na modelu jednej firmy dla narodowej infrastruktury to ogromne ryzyko. Kolektywna inteligencja to praktyczne zabezpieczenie.

    — David Ha, CEO Sakana AI

    Dołącz do czytelników

    Codziennie rano wiesz więcej o AI

    Wyciśnięta esencja ze świata sztucznej inteligencji — bez szumu, bez spamu. Co tydzień pełne podsumowanie prosto na maila.

    Bezpłatnie. Rezygnacja w każdej chwili.