NA ŻYWO
Wielkie laboratoria tracą ludzi i swobodę AI staje się sprawą państwa Co to jest SLM? Small Language Model — mały, ale zdolny Co to jest open source AI? Modele AI dostępne dla każdego Co to jest Ollama? Uruchom modele AI na swoim komputerze Co to jest destylacja modeli AI? Mniejszy model, porównywalna jakość
CYTRYNA.AI

Wielkie laboratoria tracą ludzi i swobodę

Esencja

    Dzisiejsza AI wygląda mniej jak konkurs na największy model, a bardziej jak rynek strategicznych zasobów. Najlepsi badacze zmieniają barwy, szefowie laboratoriów siadają przy stołach z przywódcami państw, Europa straszy się własnym opóźnieniem, a firmy zaczynają pytać nie „czy to działa”, tylko „kto kontroluje koszt, dostęp i odpowiedzialność”. Hype dojrzewa. Robi się politycznie i bardzo biznesowo.

    Transfery ważniejsze niż prezentacje modeli

    John Jumper, współtwórca AlphaFold i laureat Nobla z chemii, odchodzi z Google DeepMind do Anthropic. W tym samym tygodniu Noam Shazeer, jeden z autorów architektury, na której stoją współczesne modele językowe, przechodzi z DeepMind do OpenAI. OpenAI zatrudnia też Deana Balla, byłego urzędnika od polityki AI w Białym Domu, do zespołu Strategic Futures. To nie są zwykłe roszady kadrowe. To przypomina przejmowanie partnerów z kancelarii prawnej przed wielkim procesem: liczy się nazwisko, sieć kontaktów i zdolność przewidzenia ruchów regulatora.

    Dla Google to bolesny sygnał, bo DeepMind przez lata był miejscem, z którego inni chcieli rekrutować, ale rzadko mogli wygrać prestiżem. Dla Anthropic transfer Jumpera wzmacnia wiarygodność w nauce i kodowaniu. Dla OpenAI Shazeer i Ball spinają dwa światy: modelową technologię i polityczne pole minowe przed możliwym wejściem na giełdę.

    TechCrunch o przejściu Jumpera | TechCrunch o ruchach OpenAI

    Jumper po prawie dziewięciu latach w Google DeepMind przechodzi do Anthropic; wcześniej współtworzył AlphaFold, za który w 2024 r. dostał Nobla razem z Demisem Hassabisem. TechCrunch, powołując się na Bloomberga, wskazuje też jego rolę przy narzędziach kodujących Google. Shazeer idzie do OpenAI po krótkim powrocie do Google w ramach transakcji Character.AI za 2,7 mld dol. Równolegle Dean Ball ma prowadzić w OpenAI zespół Strategic Futures, zajmujący się ryzykiem katastroficznym, samodoskonaleniem modeli, rynkiem pracy i relacją laboratoriów z rządami. To koncentracja talentu technicznego i policy expertise w jednym miejscu.

    Szefowie AI wchodzą do dyplomacji

    Na szczycie G7 we Francji prezesi OpenAI, Anthropic, Google DeepMind, Mistral i innych firm AI zostali potraktowani niemal jak dodatkowa kategoria przywódców. Według Axios Sam Altman siedział obok Donalda Trumpa, Demis Hassabis obok niego, a Dario Amodei obok Emmanuela Macrona. To obrazek, który mówi więcej niż kolejna deklaracja o bezpieczeństwie.

    Państwa zrozumiały, że laboratoria AI nie sprzedają już tylko oprogramowania. Budują warstwę, która może wpływać na obronność, administrację, rynek pracy i naukę. Altman miał mówić, że żadne pojedyncze laboratorium nie powinno samo podejmować decyzji o przyszłości AI. Brzmi rozsądnie, ale też pokazuje skalę problemu: prywatne firmy są dziś na tyle ważne, że same proszą o stół negocjacyjny z państwami.

    Axios o szefach AI na G7

    G7 stał się forum rozmowy o standardach testowania, ocenie ryzyk i koordynacji państw demokratycznych wokół zaawansowanej AI. Axios opisuje zamknięty lunch roboczy, bilateralne spotkania Altmana z przywódcami oraz wystąpienia Amodeia i Hassabisa. Najważniejszy jest nie protokół, tylko zmiana pozycji negocjacyjnej: frontier labs zaczynają funkcjonować jak prywatni operatorzy infrastruktury strategicznej. Spór Anthropic z administracją USA o Fable i Mythos wygląda w tym kontekście jak próba generalna przyszłych konfliktów o modele, eksport, bezpieczeństwo i suwerenność.

    Europa straszy się własnym opóźnieniem

    W Europie popularność zdobył scenariusz „Europe 2031”, opisujący kontynent, który przegapił AI, nie zbudował centrów danych, nie stworzył własnych narzędzi i obudził się zależny od USA oraz Chin. The Guardian pisze, że tekst trafił do europosłów i do rozmów między urzędnikami z Wielkiej Brytanii i Niemiec. To nie jest raport techniczny, tylko polityczna przypowieść, ale zadziałała, bo trafiła w nerw.

    Europa lubi mówić o regulacji, prywatności i wartościach. Problem zaczyna się wtedy, gdy bez własnej infrastruktury te wartości zależą od czyjegoś przełącznika. Jeśli amerykański model może zostać ograniczony dla obcokrajowców, to europejska firma dostaje lekcję brutalnie prostą: sama zgodność z przepisami nie wystarczy, gdy nie ma się dostępu do mocy obliczeniowej, modeli i kanałów wdrożenia.

    The Guardian o scenariuszu Europe 2031

    „Europe 2031” to speculative scenario, ale jego nośność wynika z realnych napięć: kontroli eksportu modeli, luki w centrach danych, zależności od amerykańskich laboratoriów oraz słabszej komercjalizacji AI w europejskich firmach. Guardian podkreśla, że autorzy czują się wzmocnieni decyzją administracji USA o ograniczeniu dostępu obcokrajowców do modelu Anthropic Fable. Ryzyko polega na tym, że debata może przesunąć się od trzeźwej strategii do paniki infrastrukturalnej. Nadal jednak trafia w sedno: sovereignty bez compute, modeli i wdrożeń jest deklaracją, nie zdolnością.

    OpenAI zaczyna sprzedawać kontrolę kosztów

    OpenAI wprowadziło nowe analizy użycia i limity wydatków w ChatGPT Enterprise. Brzmi mniej efektownie niż premiera modelu, ale dla dużych firm to może być ważniejszy produkt. Administratorzy mają widzieć trendy zużycia kredytów, ustawiać limity dla całych zespołów i pojedynczych osób, a pracownicy mogą prosić o większy budżet wraz z uzasadnieniem.

    To znak, że AI w firmach wchodzi w etap zakupów kontrolowanych przez finanse i operacje. Pierwsza fala była entuzjazmem: dajmy wszystkim dostęp, zobaczymy co się stanie. Druga fala to arkusz kosztów, uprawnienia i pytanie, kto naprawdę używa narzędzia do pracy. AI staje się jak chmura: na początku zachwyt, potem rachunek i potrzeba zarządzania.

    OpenAI o analizach użycia i limitach wydatków

    Nowe funkcje ChatGPT Enterprise obejmują usage analytics, śledzenie trendów kredytów, limity domyślne dla workspace, limity grupowe, wyjątki dla konkretnych użytkowników oraz mechanizm request flow dla zwiększenia limitu. Cytowany przez OpenAI Zipline mówi wprost o skalowaniu adopcji Codexu i kontroli kosztów. To przesunięcie z produktowego storytellingu na governance: enterprise AI musi mieć metryki adopcji, cost allocation, role-based controls i ścieżkę eskalacji dla power users. Bez tego wdrożenie kończy się albo chaosem, albo blokadą przez działy finansów.

    Agenci uczą się rozliczać własną pracę

    Cisco pokazało FAPO, otwarty system, który automatycznie poprawia wieloetapowe przepływy pracy modeli językowych. Najpierw sprawdza, na którym kroku zadanie się psuje, potem proponuje zmiany w podpowiedziach, parametrach albo strukturze całego łańcucha, a na końcu daje wynik do niezależnej oceny. Według opisu z MarkTechPost w testach Cisco rozwiązanie wygrało z GEPA w 15 z 18 porównań.

    Nous Research idzie w podobnym kierunku od strony bezpieczeństwa pracy agenta: nowy tryb Blank Slate w Hermes Agent startuje z wyłączonymi narzędziami poza podstawami, a resztę trzeba świadomie włączyć. To dojrzewanie kategorii. Agent AI nie może być pudełkiem z setką uprawnień, które działa „jakoś”. Ma mieć zakres, audyt i mechanizm sprawdzania błędów.

    MarkTechPost o Cisco FAPO | MarkTechPost o Hermes Agent

    FAPO, czyli Fully Automated Prompt Optimization, używa orkiestracji Claude Code do optymalizacji multi-step LLM pipelines: identyfikuje failure attribution na poziomie kroku, generuje warianty promptów, parametrów i struktury łańcucha, a następnie waliduje je niezależnym reviewerem. Hermes Agent dodaje Blank Slate setup mode, gdzie aktywne zostają tylko provider, model, File Operations i Terminal, a toolsets są jawnie przypinane przez platform_toolsets.cli oraz disabled_toolsets. Razem pokazuje to kierunek agent engineering: minimal privilege, observability, step-level evals i automatyczna optymalizacja zamiast ręcznego prompt tinkeringu.

    Infrastruktura liczy każdy cykl

    Yandex udostępnił YaFF, format danych dla Protobuf, który ma czytać dane prawie tak szybko jak surowa struktura w C++. W jednym z układów odczyt był według opisu tylko 1,2 raza wolniejszy od struktury bazowej, a system rekomendacji reklamowej Yandex miał raportować 10-20% oszczędności procesora. To brzmi jak temat dla inżynierów od zaplecza, ale jego sens jest prosty: gdy AI działa na ogromnej skali, koszt ukrywa się także w przesuwaniu danych między usługami.

    Podobnie TimeCopilot pokazuje mniej medialną, ale praktyczną stronę modeli fundacyjnych: prognozowanie szeregów czasowych, wykrywanie anomalii, przedziały przewidywań i wybór modelu przez agenta. To są narzędzia dla firm, które nie chcą kolejnego czatu, tylko lepszego planowania popytu, awarii, ruchu albo finansów. AI zaczyna schodzić do miejsc, gdzie wynik mierzy się kosztami operacyjnymi, nie liczbą lajków.

    MarkTechPost o YaFF | MarkTechPost o TimeCopilot

    YaFF to zero-copy wire format dla ekosystemu Protobuf, zachowujący .proto jako source of truth i zmieniający layout danych w pamięci. MarkTechPost opisuje cztery układy: Fixed, Flat, Sparse i Dynamic; Flat Layout ma czytać w granicach 1,2x raw C++ struct, a produkcyjny recommender reklamowy Yandex raportuje 10-20% CPU savings. TimeCopilot pokazuje inną warstwę produkcyjnej AI: rolling cross-validation, modele statystyczne i fundacyjne, opcjonalne modele na procesorach graficznych (GPU), probabilistic forecasts, prediction intervals oraz agent wyboru modelu. To operational AI: mniej widowiskowa, ale bliższa P&L.

    Najważniejsze pytanie dnia nie brzmi, kto ma większy model. Brzmi: kto ma ludzi, dostęp i prawo do użycia.

    Co mówią twórcy

    Nate B. JonesYou Can't Tell If I'm Real Anymore. And That's Now YouTube's Problem Too.

    • Ryzykiem nie jest tylko perfekcyjny deepfake, lecz wystarczająco dobry klon konsumowany bez uwagi.
    • Pytanie „czy użyto AI” jest za proste: trzeba oddzielić głos, twarz, scenariusz, zgodę i końcową akceptację człowieka.
    • Twórcy i firmy potrzebują własnego stosu zaufania: ujawniania użycia AI, pochodzenia materiału, kontroli i odpowiedzialności.

    Aniket PanjwaniWhy Your Codex Goals Suck

    • Długie zadania agentowe działają dopiero wtedy, gdy cel jest kontraktem z testami parytetu i kryteriami odbioru.
    • Najpierw buduje się wzorzec zachowania z istniejących implementacji, potem odpala agenta.
    • Zewnętrzny przegląd przed startem wyłapuje fałszywe sukcesy, braki dowodów, licencje i problemy wydajności.

    Itssssss JackThis OpenSource Repo will 10X Your Hermes Agent

    • Agent Reach nie zwiększa inteligencji modelu, tylko poprawia wybór narzędzi dla YouTube, GitHuba, RSS, Reddita, X i stron WWW.
    • Czysta ekstrakcja treści zamiast surowego HTML może mocno obniżyć koszt tokenów.
    • Największa wartość jest w jednym systemie badawczym, który łączy głos, komunikatory, wyszukiwarkę, źródła społecznościowe i CRM.

    Simon ScrapesClaude Code Just Hit A Different Level (We Built THIS)

    • Budowanie własnego narzędzia ma sens, gdy problem jest rdzeniem wartości produktu albo gotowe rozwiązania nie domykają procesu.
    • Nie warto odtwarzać pełnego CRM dla małej oszczędności, jeśli utrzymanie zje cały zysk.
    • Dobry wzorzec pracy to przyczyna problemu, małe fazy, decyzja budować czy kupować i wąski zakres.

    Koncentrat

    Dzisiejszy obraz rynku jest trzeźwiący. Laboratoria AI kupują ludzi tak, jak banki inwestycyjne kupują całe zespoły transakcyjne. Państwa zapraszają szefów firm do rozmów o standardach, bo same nie mają pełnej kontroli nad technologią. Europa zaczyna rozumieć, że regulacja bez infrastruktury daje poczucie porządku, ale nie daje siły. Firmy proszą o limity kosztów, audyt i zarządzanie narzędziami, bo AI przestaje być eksperymentem dla chętnych. To nie koniec entuzjazmu. To koniec niewinności.

    Dzień spina pięć warstw dojrzałości rynku: talent concentration między DeepMind, Anthropic i OpenAI; geopolitical governance na G7; sovereignty anxiety w Europie; enterprise cost controls w ChatGPT Enterprise; agent engineering przez FAPO, Hermes i narzędzia infrastrukturalne w rodzaju YaFF. Frontier model pozostaje ważny, ale przewaga coraz częściej zależy od portfela kompetencji: researcher density, policy access, compute sovereignty, operational governance i kosztu wykonania na produkcji. AI wchodzi w etap, w którym demo bez systemu kontroli jest tylko ładnym ryzykiem.

    Dołącz do czytelników

    Codziennie rano wiesz więcej o AI

    Wyciśnięta esencja ze świata sztucznej inteligencji — bez szumu, bez spamu. Co tydzień pełne podsumowanie prosto na maila.

    Bezpłatnie. Rezygnacja w każdej chwili.