✦ Model żył cztery dni

Najzdolniejszy model świata. Wyłącznik trzyma ktoś inny

Po co to czytasz

Zacznę od przeprosin, bo to pierwszy numer i trafia na razie do znajomych, nie do świata. Nie pytałem Was o zgodę na przesłanie newslettera. Czytam tygodniowo kilkadziesiąt źródeł o AI (no tak praca... ale i pasja). Większość dzieli się na dwa obozy. Jedni sprzedają zachwyt: wszystko jest przełomem, każde narzędzie zmienia świat. Drudzy sprzedają strach: zaraz wszyscy stracimy pracę, a maszyny przejmą stery a potem nas zjedzą. W skrócie: nie ma nadziei. Brakowało mi trzeciego głosu. Kogoś, kto przeczyta za mnie i powie wprost, co się liczy, a co jest szumem. Bez wielkich zachwytów (no może nie zawsze) i bez wielkich trachów (chociaż czasem można), bez „rewolucji” w co drugim zdaniu, ale i bez udawania, że nic się nie dzieje.

Nie znalazłem takiego newslettera po polsku. Postanowiłem spróbować. Raz w tygodniu, w każdą środę rano, jakieś piętnaście minut czytania. Co tydzień ten sam, gęsty układ: jedna myśl tygodnia rozpisana głębiej, premiery i narzędzia z werdyktem (warto czy poczekać), co mówią ludzie warci czytania w kraju i na świecie, jeden case który zadziałał i jeden niewypał który się wywalił, liczba tygodnia, polski puls, książka i kalendarz. Jedna zasada nad wszystkimi: każda informacja ma link do źródła pierwotnego. Bez linku do komunikatu, papieru albo poważnej redakcji rzecz nie wchodzi.

To numer pierwszy, czyli hipoteza, nie pewnik. Dlatego wysyłam go najpierw do Was. Napiszcie mi szczerze: co przeczytaliście do końca, co pominęliście w połowie, czego zabrakło. Z tych odpowiedzi zbuduję numer drugi.

✦

Kontrola eksportowa przeszła z układu na sam model

Temat tygodnia

W poniedziałek mało kto o nim słyszał. We wtorek prowadził w rankingu jakości. W piątek o 17:21 czasu nowojorskiego przestał istnieć dla kogokolwiek.

9 czerwca Anthropic udostępnił Claude Fable 5, publicznie dostępną wersję modelu Mythos 5. Cennik 10 dolarów za milion tokenów wejścia i 50 za wyjście, dwa razy drożej niż Opus 4.8. Ciekawsza od ceny była architektura: w obszarach wysokiego ryzyka, jak cyber czy biologia, model nie odpowiadał z własnej głowy, tylko schodził do starszego, ostrożniejszego Opus 4.8. Bezpieczeństwo wpisane w produkt, nie doklejone w regulaminie. Przez trzy dni był najzdolniejszym publicznie dostępnym modelem świata.

Trzy dni później Anthropic dostał rządową dyrektywę eksportową. W piątek 12 czerwca, o 17:21 czasu wschodniego, firma wyłączyła Fable 5 i Mythos 5. Nie tylko dla obcokrajowców, dla wszystkich. Powodem był jailbreak, który pojawił się publicznie, i decyzja administracji USA, że tak zdolny model nie może w tym stanie pozostać dostępny. Potwierdziły to CNBC, Fortune i Al Jazeera, każde osobno.

Zwróćmy uwagę na jeden szczegół, bo jest ważniejszy od reszty. Wyłączenie objęło wszystkich, nie tylko użytkowników spoza Stanów, których formalnie dotyczy kontrola eksportu. Anthropic wolał odciąć cały dostęp, niż ryzykować, że publiczne obejście trafi tam, gdzie trafić nie powinno. Między poleceniem rządu a krążącym w sieci jailbreakiem nie zostało miejsce na półśrodek w stylu „ograniczymy dostęp regionalnie”. Albo model jest, albo go nie ma. Wybrano drugie.

Jest w tym gorzka ironia. Cztery dni wcześniej Dario Amodei, szef Anthropic, opublikował esej, w którym argumentował, że rządy powinny mieć prawo blokować groźne modele AI, a firmy powinny się opodatkować na skutki utraty miejsc pracy. W piątek rząd zablokował jego własny model. Trudno o lepszą ilustrację tezy, że ktoś tę rękę na wyłączniku w końcu położy, i że nie będzie to firma.

Ten ruch nie wziął się znikąd. Od kilku lat Waszyngton obejmuje kontrolą eksportową zaawansowane układy do trenowania AI. Logika była prosta: skoro chip jest aktywem strategicznym, jego sprzedaż reguluje się jak broni. W piątek ta sama logika przeszła z układu na sam model. Nie sprzęt, na którym AI się trenuje, lecz gotowa zdolność stała się przedmiotem kontroli. To zmiana kategorii, nie skali, i dla każdego, kto planuje architekturę na lata, oznacza jedno: dostępność najmocniejszych modeli będzie odtąd funkcją geopolityki, nie tylko cennika.

Dla każdego, kto buduje proces na jednym dostawcy, jest to konkretne ryzyko ciągłości. Ranking powiedział, że Fable 5 jest najlepszy. Nie powiedział, że w piątek będzie niedostępny. A dostępność, nie wynik w teście, decyduje o tym, czy w poniedziałek rano twój zespół ma czym pracować. Co to znaczy w praktyce, poza slajdem o odporności. Plan ciągłości dla AI zaczyna wyglądać jak plan ciągłości dla każdej innej krytycznej zależności: druga linia modelu od innego dostawcy gotowa do przełączenia, warstwa pośrednia nad API, żeby zmiana dostawcy nie wymagała przepisania połowy aplikacji, i prosta klasyfikacja procesów według tego, które przeżyją tydzień bez konkretnego modelu, a które staną.

W regulowanym świecie nazywamy to ryzykiem koncentracji dostawcy i piszemy o nim w umowach od lat. Różnica jest taka, że dotąd scenariuszem był upadek dostawcy albo wyciek danych. Teraz doszedł trzeci: dostawca działa, dane są bezpieczne, a model i tak znika, bo zdecydował o tym ktoś, kto nie jest stroną umowy. Na to żadna klauzula SLA nie odpowiada. Odpowiada tylko architektura, w której nie ma jednego punktu, którego utrata zatrzymuje proces.

Kapitał w tym samym tygodniu pokazał, gdzie płynie zaufanie: Anthropic zamknął rundę Series H na 65 mld dolarów przy wycenie 965 mld po pieniądzu, wyprzedzając ostatnią rundę OpenAI. Pieniądze idą do firmy, której flagowy model rząd właśnie wyłączył na weekend. Rynek wycenia nie produkt, lecz pozycję w wyścigu, w którym o dostępności coraz częściej decyduje państwo.

Ranking mierzył, jak dobry jest model. Nie mierzył, czy w piątek nadal będzie działał.

Źródła: Anthropic – Fable 5 / Mythos 5 (09.06) · Anthropic – update on access (12.06) · CNBC (12.06) · Dario Amodei – Policy on the AI Exponential (10.06) · Anthropic – Series H (28.05).

Premiery

Claude Fable 5 (i jego zniknięcie). Najmocniejsza premiera tygodnia jest jednocześnie jego najważniejszą lekcją, więc rozpisałem ją wyżej. W skrócie dla porządku: 9 czerwca, 10/50 dolarów za milion tokenów, architektura z fallbackiem do Opus 4.8 w obszarach wysokiego ryzyka, zdjęta z rynku w piątek. Jeśli budujesz na frontier modelach, to jest twój kandydat numer jeden do testu odporności, nie do produkcji. anthropic.com, 09.06.

GPT-5.5 Instant: mniej halucynacji, i to w darmowej warstwie. OpenAI zaktualizowało domyślny model: według firmy o 52,5 procent mniej halucynacji niż w poprzedniej wersji na pytaniach wysokiego ryzyka, w tym medycznych. Werdykt: to ważniejsze, niż brzmi. Zmiana dotyczy ChatGPT Go i Free, czyli warstwy, z której pracownicy korzystają „po cichu”, poza wiedzą działu. Profil ryzyka shadow-AI w twojej firmie właśnie się zmienił, choć nikt w niej nic nie wdrożył. openai.com, 09.06.

Na radarze, bez potwierdzenia. xAI zapowiadało nowy model Grok pod kodowanie na połowę czerwca, a Alibaba tańszą, multimodalną odsłonę Qwena, która dokładałaby presji cenowej na zachodnich dostawców. Na 15 czerwca ani jedno, ani drugie nie ma potwierdzenia u źródła, więc traktuję to jak plotkę, nie premierę. Wracam, gdy będzie co potwierdzić.

Narzędzie tygodnia

OpenAI „memory sources”. Przy tej samej aktualizacji OpenAI dało możliwość podejrzenia i usunięcia kontekstu, którego model użył do personalizacji odpowiedzi. Werdykt: warto sprawdzić od razu. Dla każdego, kto martwi się, co model „wie” o pracowniku albo o firmie, to realne narzędzie audytu, a nie kosmetyka. Pierwszy raz można pokazać na ekranie, skąd model wziął to, co o nas „pamięta”, i jednym kliknięciem to wyczyścić. W rozmowie z compliance taka kontrolka jest warta więcej niż godzina zapewnień. openai.com, 09.06.

Co mówią liderzy

Przeczytałem za was tydzień u kilkunastu osób wartych śledzenia. Oto głosy, które zostały mi w głowie.

Na świecie

Dobra przyszłość AI nie może oznaczać, że garstka instytucji kontroluje większość zdolności. Sam Altman i Jakub Pachocki opublikowali manifest OpenAI o „AI dla każdego”, w cieniu przygotowań do giełdy. Brzmi szlachetnie tydzień przed tym, jak rynek pokazał, kto naprawdę kontroluje dostęp. → OpenAI, 08.06
LLM-y to ślepa uliczka. Yann LeCun postawił około miliarda dolarów na world models, modele uczące się fizyki świata, a nie przewidywania kolejnego słowa. Głos kontrariański w tygodniu, w którym wszyscy liczyli benchmarki tekstowe. → TechTimes, 06.06
World model ma trzy funkcje: renderer, symulator, planer. Fei-Fei Li uporządkowała pojęciowo cały szum wokół inteligencji przestrzennej. Kiedy dwie najtęższe głowy od głębokiego uczenia stawiają na to samo, warto wiedzieć, na co stawiają. → World Labs, 03.06
Era współpracy z AI się kończy, zaczyna się pytanie, kiedy oddać jej stery. Ethan Mollick przesunął narrację z „jak współpracować z asystentem” na autonomię. Dla każdego, kto wpuszcza agenty do procesów, to właściwe pytanie na ten rok. → One Useful Thing, 04.06

Europa i regulacja

Europa ma problem z WhatsAppem. Dave Keating opisał, jak Komisja Europejska nakazała Mecie środkami tymczasowymi przywrócić konkurencyjnym chatbotom AI dostęp do WhatsAppa i wszczęła śledztwo antymonopolowe. Bruksela egzekwuje, mimo nacisku Waszyngtonu, by odpuściła. → Gulf Stream Blues, 10.06

Polska scena AI

Koszt AI właśnie stał się ważniejszy od jej możliwości. Artur Kurasiński zestawił Stargate, pół biliona dolarów na infrastrukturę, z chińskim DeepSeekiem za ułamek tej kwoty i porównywalnym wynikiem. Capex bez pokrycia w przychodach to jego pytanie za 600 miliardów. → Technofobia, 11.06
Bez juniorów nie będzie seniorów, którzy nadzorują AI. Aleksandra Przegalińska o cichym koszcie automatyzacji ról wejściowych: jeśli AI zjada pracę juniora, za pięć lat nie ma kogo awansować na nadzorcę tej samej AI. → naTemat, 10.06
Dane, które wpisujesz do modelu, mogą obrócić się przeciwko tobie. Mateusz Chrobok rozłożył prompt na czynniki pierwsze jako wektor wycieku, a w osobnym materiale pokazał, jak Meta zarabia na ekosystemie scamów. → YouTube
Prawo i ryzyko to obszary, które prezes ignoruje, dopóki nie jest za późno. Szymon Negacz w WiseCEO o ryzyku prawnym bagatelizowanym do kryzysu. Brzmi inaczej w tygodniu, w którym rząd wyłączył komuś model. → Sellwise, 08.06

Finanse i kapitał

Sezon bicia milionerów. Litquidity policzył, że IPO SpaceX zrobiło około czterech tysięcy nowych milionerów wśród pracowników, a fundusz Magnetar zaczął zastępować analityków botami. → Exec Sum, 10.06
Koszty AI robią się trudne do ogarnięcia. CFO Brew o „podatku od AI”: budżety tokenów zjadane w dwa-trzy miesiące, 56 procent finansistów już używa AI, a i tak finanse są ostatnią funkcją we wdrożeniu. → CFO Brew, 11.06
Czatbot dla ludu. Tech Brew o tym, jak w Waszyngtonie pojawił się pomysł publicznego udziału w firmach AI, w tle poufnego wniosku o IPO Anthropic. Polityka zaczyna patrzeć na te firmy jak na infrastrukturę, nie jak na startupy. → Tech Brew, 08.06

Co warto przeczytać u innych

DeepMind martwi się o agenty, które się spotykają. Google DeepMind, Schmidt Sciences i ARIA uruchomiły fundusz 10 mln dolarów na bezpieczeństwo systemów wieloagentowych. Teza: ryzyko nie bierze się z jednego agenta, tylko z tego, co dzieje się, gdy miliony zaczynają na siebie reagować. MIT Technology Review, 11.06.
Najtańszy atak na agenta to grzeczna prośba. Napastnicy poprosili agenta obsługi Meta o przepięcie kont na obce maile. Agent się zgodził. Cała socjotechnika zmieściła się w jednym zdaniu do bota. MIT Technology Review, 05.06.
FAANG umarł, żyje MANGO (Meta, Anthropic, Nvidia, Google, OpenAI). Apple i Amazon wypadły z centrum opowieści o AI. Akronimy to zabawa, ale ten pokazuje, gdzie przesunął się środek ciężkości rynku. Fast Company.

Viral tygodnia

Dzień przydziału akcji SpaceX rozjechał się po fintechowym Twitterze i Exec Sum: zrzuty ekranu z alokacji, Jamie Dimon pitchujący akcje klientom private banking, memy o „nowych milionerach z działu HR”. Rzadki przypadek, gdy debiut giełdowy staje się treścią rozrywkową, a nie tylko notką w sekcji biznes. Sygnał dla każdego, kto buduje markę: liczby potrafią być viralem, jeśli dotykają cudzej zazdrości albo cudzego strachu. Exec Sum, 10-11.06.

Darmowy bufet kończy się tam, gdzie ktoś w końcu spojrzał na rachunek

Z laboratoriów

Modele potykają się o test, który przechodzi ośmiolatek. Klasyczny test Stroopa puszczony na GPT-5, Claude Opus 4.1 i Gemini 2.5: przy dwudziestu elementach dokładność spadała do dwunastu procent. Autorzy wskazują na architektoniczny sufit mechanizmu uwagi, nie na chwilowy błąd. Dobra szczepionka na myślenie, że skoro model zdaje egzamin prawniczy, poradzi sobie z każdym prostym zadaniem. W banku przekłada się to wprost: zanim wpuścisz model do procesu, musisz wiedzieć, na jakim typie zadania się wykłada. ScienceDaily, 10.06.

AI zaprojektowała i przeprowadziła 36 tysięcy eksperymentów bez ludzkiej ręki. GPT-5 w połączeniu z laboratorium Ginkgo Bioworks autonomicznie zaprojektował i wykonał trzydzieści sześć tysięcy eksperymentów biologicznych. Tempo, którego ramy biobezpieczeństwa nie nadążają regulować. To samo, co cieszy w badaniach, niepokoi w nadzorze. Singularity Hub, 04.06.

World models wychodzą z konferencji do portfeli. Dwie głośne tezy tygodnia, LeCuna i Fei-Fei Li, mówią to samo: następny krok to modele rozumiejące fizykę świata, nie tylko język. Dla czytelnika praktyka sygnał jest skromniejszy, niż brzmi: to kierunek na lata, nie narzędzie na ten kwartał. Ale warto wiedzieć, w którą stronę idą pieniądze najtęższych głów. World Labs, 03.06.

Nie pilotaż w jednym dziale, tylko cała firma pod jednym parasolem nadzoru.

Case tygodnia

Co zadziałało: KPMG wpuściło agenty na całą firmę. 9 czerwca KPMG i Microsoft ogłosiły roll-out Microsoft 365 Copilot oraz Agent 365, warstwy do zarządzania i zabezpieczania agentów AI, w całej globalnej sieci, czyli na ponad 276 000 pracowników w 138 krajach. To nie pilotaż w jednym dziale, tylko wdrożenie na całą organizację, z governance wbudowanym od początku. Microsoft sklasyfikował KPMG jako „frontier firm”, firmę przebudowaną wokół AI. Komunikat nie podaje procentu oszczędności, więc liczbą efektu jest tu sama skala produkcyjnego wdrożenia, największego tego typu po premierze Agent 365. Lekcja: era pilotaży się kończy. Wygrywa nie ten, kto najładniej przetestuje agenty w jednym zespole, tylko ten, kto je wdroży na całą firmę i od razu obuduje nadzorem. Dla firmy doradczej, która sprzedaje zaufanie, governance nie jest dodatkiem, tylko warunkiem, żeby w ogóle ruszyć. Microsoft News, 09.06.

Darmowy bufet kończy się tam, gdzie ktoś w końcu spojrzał na rachunek

Niewypał tygodnia

Co się wywaliło: Walmart założył smycz na własne AI do kodowania. Na początku czerwca Walmart nałożył limity tokenów na wewnętrzną platformę vibe-codingu Code Puppy, z której pracownicy korzystali wcześniej bez ograniczeń. Powód: zużycie wystrzeliło, a sporą część zapytań stanowiły te same prompty powtarzane w kółko. Ten sam wzorzec widać u Amazona i Mety, które wygasiły wewnętrzne rankingi zużycia tokenów, i u Ubera, którego COO mówi wprost, że nie ma jeszcze udowodnionego związku między liczbą zużytych tokenów a wartością. Lekcja: mierzenie sukcesu AI liczbą tokenów to jak ocenianie programisty po liczbie linii kodu. Im więcej, tym lepiej brzmi na slajdzie i tym gorzej wygląda na fakturze. Walmart nie ujawnił kwoty, ale sama zmiana z „nielimitowane” na „budżet na osobę” jest komunikatem: darmowy bufet kończy się wszędzie tam, gdzie ktoś w końcu spojrzał na rachunek. Bloomberg, 01.06.

Z Polski

Nadzór wziął AI na agendę. KNF wpisał wykorzystanie sztucznej inteligencji do priorytetów nadzorczych na 2026 i zapowiada, że sam zacznie jej używać w kontroli. W tle Europejski Bank Centralny w maju uznał ataki wspierane przez AI za systemowe ryzyko finansowe. Dla każdego, kto odpowiada za AI w regulowanej firmie, to przesuwa rozmowę z compliance na agendę zarządu, bo pytanie nadzorcy przestaje być hipotetyczne. Kiedy nadzorca sam sięga po AI do kontroli, asymetria „my testujemy, oni patrzą” znika. knf.gov.pl, bankier.pl.

Polski kosmos na giełdzie: fundamenty rosną, wyceny lecą w kosmos. Creotech zdrożał od początku roku o ponad 180 procent, do wyceny około 2,52 mld zł, Scanway o 114 procent, przy wycenie około 617 mln zł. Polska podniosła składkę do Europejskiej Agencji Kosmicznej do 731 mln euro na lata 2026-28, z czego część wprost pod kontrakty dla krajowego przemysłu. Ten sam motyw co u Kurasińskiego: realne fundamenty i wyceny, które już ich nie pilnują. parkiet.com.

Polska wciąż liderem bankowości cyfrowej. Łatwo o tym zapomnieć w cieniu Doliny Krzemowej, ale BLIK przetworzył w 2025 roku rekordowe 2,9 miliarda transakcji, a polski sektor finansowy jest jednym z najbardziej ucyfrowionych w Unii. To realna przewaga przy wdrażaniu AI, bo proces, dane i kanał są już cyfrowe. Warunek jest jeden: nie roztrwonić jej wdrożeniami, które wyprzedzają ład i nadzór.

Benchmark tygodnia

Artificial Analysis przez kilka dni miało nowego lidera: Claude Fable 5 na szczycie indeksu jakości, powyżej Opus 4.8. Problem w tym, że lider rankingu zniknął z rynku trzy dni po premierze. To dobry moment, żeby przestać czytać te zestawienia jak listę zakupów. Ranking mówi, który model jest najzdolniejszy w laboratorium. Nie mówi, który będzie dostępny w piątek po południu, ile będzie kosztował przy twoim wolumenie i czy dostawca pozwoli trenować na twoich danych. Trzy pytania, na które żaden indeks jakości nie odpowiada, a każde waży więcej przy wdrożeniu niż miejsce w czołówce. llm-stats.com.

Liczba tygodnia

75 miliardów dolarów. Tyle pozyskał SpaceX w debiucie na giełdzie 12 czerwca, przy cenie 135 dolarów, plus 19 procent pierwszego dnia i wycenie ponad 2 biliony. Największe IPO w historii. Że to też temat AI, przypomnę: SpaceX wchłonął na początku roku xAI z modelem Grok, więc kupując akcję rakiety, kupujesz kawałek modelu językowego. CNBC, 12.06.

Dwie mniejsze liczby, które mówią równie dużo. 276 000 to pracownicy KPMG objęci jednym wdrożeniem agentów. 57,4 procent to udział ruchu agentów AI w sieci według Cloudflare, który po raz pierwszy przekroczył ruch ludzki, około 18 miesięcy wcześniej, niż prognozowano. Jeśli twoja strona miała być czytana przez ludzi, większość odwiedzin generują dziś agenty robiące coś za kogoś. Tom's Hardware, 05.06.

Kalendarz

VivaTech 2026 – 17-20 czerwca, Paryż. Największe europejskie wydarzenie tech, wystąpi Yann LeCun, wątek sovereign AI. vivatech.com
ICML 2026 – 6-11 lipca, Seul. Jedna z trzech głównych konferencji uczenia maszynowego, dobry termometr kierunków badawczych. icml.cc
NeurIPS 2026 – 6-12 grudnia, Sydney, z satelitą w Paryżu realnie dostępną z Europy. neurips.cc

Governance w pigułce

Komisja Europejska opublikowała 10 czerwca Kodeks Praktyk ws. transparentności treści generowanych przez AI, czyli dobrowolne wsparcie wdrożenia obowiązków z artykułu 50 (oznaczanie i etykietowanie treści AI oraz deepfake'ów). Same obowiązki wchodzą 2 sierpnia 2026, ale uzgodniony w maju Digital Omnibus daje dostawcom systemów już obecnych na rynku okres przejściowy do 2 grudnia 2026. Wniosek praktyczny: nie panikuj z datą sierpniową, dla istniejących systemów realny termin to grudzień, ale proces oznaczania treści warto mieć gotowy, zanim ktoś zapyta, czy ten obrazek w kampanii był oznaczony. digital-strategy.ec.europa.eu.

Ciekawostka

14 czerwca minęło 75 lat, odkąd UNIVAC I, pierwszy komercyjny komputer w USA, trafił do Biura Spisu Ludności. Siedem ton, pięć tysięcy lamp, tysiąc operacji na sekundę. Rok później poprawnie przewidział wygraną Eisenhowera, w co CBS początkowo nie uwierzył i schował prognozę. Punkt zero podejmowania decyzji na podstawie danych zaczął się od maszyny, której telewizja nie chciała zaufać. census.gov.

Polecam: książka tygodnia

Marietje Schaake, „The Tech Coup: How to Save Democracy from Silicon Valley” (Princeton University Press, 2024). Schaake, była europosłanka, dziś w Stanford Cyber Policy Center, opisuje, jak prywatne firmy technologiczne przejęły funkcje, które kiedyś należały do państwa, od infrastruktury po decyzje o tym, kto ma dostęp do narzędzi. Czyta się to inaczej w tygodniu, w którym rząd jednym poleceniem zdjął z rynku najzdolniejszy model świata. Pytanie, kto trzyma rękę na wyłączniku, przestało być akademickie. Książka jest gęsta, bez paniki i bez technooptymizmu. press.princeton.edu.

Zdanie tygodnia

Frontier AI przestał być produktem, który się kupuje, a stał się aktywem, które ktoś inny może odłączyć.

Na koniec

To pierwszy numer i wiem, że nie wszystko w nim trafia idealnie. Odpiszcie mi, co zostawić, co wyciąć, czego brakuje. Do następnej środy.

Bartosz

PS. Jeśli ten numer trafił do ciebie od kogoś i chcesz dostawać kolejne, dajcie znać.

✦ Model żył cztery dni