This website uses cookies

Read our Privacy policy and Terms of use for more information.

W trzech zdaniach

  • Najzdolniejszy publicznie dostępny model zniknął po czterech dniach: o dostępności AI decyduje już geopolityka, nie cennik.

  • Walmart uciął pracownikom nielimitowane tokeny: koniec mylenia zużycia AI z produktywnością.

  • KNF bierze AI na celownik nadzorczy 2026: pytanie regulatora przestaje być hipotetyczne.

Najzdolniejszy model świata. Wyłącznik trzyma ktoś inny

Po co to czytasz

Zacznę od przeprosin, bo to pierwszy numer i trafia na razie do znajomych, nie do wszystkich. I podziękowań, bo zapisaliście się sami.
Czytam tygodniowo kilkadziesiąt źródeł o AI (no tak praca... ale i pasja). Większość dzielę na dwa obozy. Ultraentuzastów: wszystko jest przełomem, każde narzędzie zmienia świat. Drudzy sprzedają strach: zaraz wszyscy stracimy pracę, a maszyny przejmą stery a zaraz potem nas zjedzą. W skrócie: nie ma nadziei. Brakowało mi trzeciego głosu. Kogoś, kto przeczyta, spróbuje zrozumieć i powie, co się liczy, a co jest nie potwierdzoną ściemą (albo i potwierdzoną :)). Bez wielkich zachwytów (chociaż pewnie czasem się zachwycę) i bez wielkich dram (chociaż czasem pewnie będą), bez „rewolucji” w co drugim zdaniu, ale i bez udawania, że nic się nie dzieje.

Nie znalazłem takiego newslettera po polsku, więc go robię. Raz w tygodniu, w środę rano, jakieś piętnaście/dwadzieścia minut czytania. Co tydzień ten sam, gęsty układ: jedna myśl tygodnia rozpisana głębiej, premiery i narzędzia z werdyktem (warto użyć czy poczekać), co mówią ludzie warci czytania w kraju i na świecie, jeden case który zadziałał i jeden niewypał który się wywrócił, liczba tygodnia, polski puls, książka i kalendarz.

No i jedna podstawowa zasada: każda informacja ma link do źródła pierwotnego.

To numer pierwszy, pewnego rodzaju hipoteza. Dlatego wysyłam go najpierw do Was. Napiszcie mi szczerze: co przeczytaliście do końca, co pominęliście w połowie, czego zabrakło. No i czego było za dużo. Z tych odpowiedzi zbuduję numer drugi, a potem następne…

Dziękuję, że jesteście.

Kontrola eksportowa przeszła z układu na sam model

Temat tygodnia

W poniedziałek mało kto o nim słyszał. We wtorek prowadził w rankingu jakości. W piątek o 17:21 czasu nowojorskiego przestał istnieć.

9 czerwca Anthropic udostępnił Claude Fable 5, publicznie dostępną wersję modelu Mythos 5. Cennik 10 dolarów za milion tokenów wejścia i 50 za wyjście, dwa razy drożej niż Opus 4.8. Równie ciekawa jak cena była architektura: w obszarach wysokiego ryzyka, jak cyber czy biologia, model nie odpowiadał z własnej głowy, tylko schodził do starszego, ostrożniejszego, sprawdzonego Opusa 4.8. Bezpieczeństwo wpisane w produkt, nie doklejone w regulaminie. Przez trzy dni był najzdolniejszym publicznie dostępnym modelem świata. I przez te trzy dni sprawił, że i my byliśmy doskonalsi.

Trzy dni później Anthropic dostał rządową dyrektywę eksportową. W piątek 12 czerwca, o 17:21 czasu wschodniego, firma wyłączyła Fable 5 i Mythos 5. Nie tylko dla obcokrajowców, dla wszystkich. Powodem był jailbreak, który pojawił się publicznie, i decyzja administracji USA, że tak zdolny model nie może w tym stanie pozostać dostępny. Potwierdziły to CNBC, Fortune i Al Jazeera, każde osobno.

Zwróćmy uwagę na jeden szczegół. Wyłączenie objęło wszystkich, nie tylko użytkowników spoza Stanów, których formalnie dotyczy kontrola eksportu. Anthropic wolał odciąć cały dostęp, niż ryzykować, że publiczne obejście trafi tam, gdzie trafić nie powinno i dostanie karę. Między poleceniem rządu a krążącym w sieci jailbreakiem nie zostało miejsce na półśrodek w stylu „ograniczymy dostęp regionalnie”. Albo model jest, albo go nie ma. Wybrano drugie. A na czym polegał sam jailbreak? Model potrafił wskazać „dziury” w kodzie na podstawie… adresu www.

Cztery dni wcześniej Dario Amodei, szef Anthropic, opublikował esej, w którym argumentował, że rządy powinny mieć prawo blokować groźne modele AI, a firmy powinny się opodatkować na skutki utraty miejsc pracy. W piątek rząd zablokował jego własny model. Trudno o lepszą ilustrację tezy, że ktoś tę rękę na wyłączniku w końcu położy.

Ten ruch nie wziął się znikąd. Od kilku lat Waszyngton obejmuje kontrolą eksportową zaawansowane układy do trenowania AI. Logika była prosta: skoro chip jest aktywem strategicznym, jego sprzedaż reguluje się jak obrót bronią. W piątek ta sama procedura przeszła z hardweru na sam model. Nie sprzęt, na którym AI się trenuje, lecz gotowa zdolność stała się przedmiotem kontroli. Dla każdego, kto planuje architekturę oznacza jedno: dostępność najmocniejszych modeli będzie odtąd funkcją geopolityki, nie tylko cennika.

Dla każdego, kto buduje proces na jednym dostawcy, jest to konkretne ryzyko ciągłości. Ranking powiedział, że Fable 5 jest najlepszy. Nie powiedział, że w piątek będzie niedostępny. A to dostępność, nie wynik w benchmarku, decyduje o tym, czy w poniedziałek rano twój zespół ma czym pracować. Plan ciągłości dla AI zaczyna wyglądać jak plan ciągłości dla każdej innej krytycznej zależności: druga linia modelu od innego dostawcy gotowa do przełączenia, warstwa pośrednia nad API, żeby zmiana dostawcy nie wymagała przepisania połowy aplikacji, i prosta klasyfikacja procesów według tego, które przeżyją tydzień bez konkretnego modelu, a które staną.

W regulowanym świecie nazywamy to ryzykiem koncentracji dostawcy i piszemy o nim w umowach od lat. Różnica jest taka, że dotąd scenariuszem był upadek dostawcy albo wyciek danych. Teraz doszedł trzeci: dostawca działa, dane są bezpieczne, a model i tak znika, bo zdecydował o tym ktoś, kto nie jest stroną umowy. Na to żadna klauzula SLA nie odpowiada. Odpowiada tylko architektura, w której nie ma jednego punktu, którego utrata zatrzymuje proces.

Na poziomie państwa i regionu pojawiają się pytania o suwerenność. O tym pisałem na Linkedinie.

Kapitał w tym samym tygodniu pokazał, gdzie płynie zaufanie: Anthropic zamknął rundę Series H na 65 mld dolarów przy wycenie 965 mld po pieniądzu, wyprzedzając ostatnią rundę OpenAI. Pieniądze idą do firmy, której flagowy model rząd właśnie wyłączył na weekend. Rynek wycenia nie produkt, lecz pozycję w wyścigu, w którym o dostępności coraz częściej decyduje państwo.

Ranking mierzył, jak dobry jest model. Nie mierzył, czy w piątek nadal będzie działał.

Premiery

Claude Fable 5 (i jego zniknięcie). Najmocniejsza premiera tygodnia jest jednocześnie jego najważniejszą lekcją, więc rozpisałem ją wyżej. W skrócie dla porządku: 9 czerwca, 10/50 dolarów za milion tokenów, architektura z fallbackiem do Opus 4.8 w obszarach wysokiego ryzyka, zdjęta z rynku w piątek. Jeśli budujesz na frontier modelach, to jest twój kandydat numer jeden do testu odporności, nie do produkcji. anthropic.com, 09.06.

Na radarze, bez potwierdzenia. xAI zapowiadało nowy model Grok pod kodowanie na połowę czerwca, a Alibaba tańszą, multimodalną odsłonę Qwena, która dokładałaby presji cenowej na zachodnich dostawców. Na 16 czerwca ani jedno, ani drugie nie ma potwierdzenia u źródła, więc traktuję to jak plotkę, nie premierę. Wrócę, gdy będzie co potwierdzić.

Narzędzie tygodnia

OpenAI „memory sources”. Przy aktualizacji OpenAI dało możliwość podejrzenia i usunięcia kontekstu, którego model użył do personalizacji odpowiedzi. Werdykt: warto sprawdzić od razu. Dla każdego, kto martwi się, co model „wie” o pracowniku albo o firmie, to realne narzędzie audytu. Pierwszy raz można pokazać na ekranie, skąd model wziął to, co o nas „pamięta”, i jednym kliknięciem to wyczyścić. W rozmowie z compliance taka kontrolka jest warta więcej niż godzina zapewnień. openai.com, 09.06.

Co mówią liderzy

Przeczytałem za was tydzień u kilkunastu osób wartych śledzenia. Oto głosy, które zostały mi w głowie.

Na świecie

  • Dobra przyszłość AI nie może oznaczać, że garstka instytucji kontroluje większość zdolności. Sam Altman i Jakub Pachocki opublikowali manifest OpenAI o „AI dla każdego”, w cieniu przygotowań do giełdy. Brzmi szlachetnie tydzień przed tym, jak rynek pokazał, kto naprawdę kontroluje dostęp. → OpenAI, 08.06

  • LLM-y to ślepa uliczka. Yann LeCun (długo odpowiadał za AI w Meta) postawił około miliarda dolarów na world models, modele uczące się fizyki świata, a nie przewidywania kolejnego słowa. Głos kontrariański w tygodniu, w którym wszyscy liczyli benchmarki tekstowe. → TechTimes, 06.06

  • World model ma trzy funkcje: renderer, symulator, planer. Fei-Fei Li (CEO World Labs) uporządkowała pojęciowo cały szum wokół inteligencji przestrzennej. Kiedy dwie najtęższe głowy od głębokiego uczenia stawiają na to samo, warto wiedzieć, na co stawiają. → World Labs, 03.06

  • Era współpracy z AI się kończy, zaczyna się pytanie, kiedy oddać jej stery. Ethan Mollick (autor bestsellera Co-Intelligence) przesunął narrację z „jak współpracować z asystentem” na autonomię. Dla każdego, kto wpuszcza agenty do procesów, to właściwe pytanie na ten

Europa i regulacja

  • Europa ma problem z WhatsAppem. Dave Keating opisał, jak Komisja Europejska nakazała Mecie środkami tymczasowymi przywrócić konkurencyjnym chatbotom AI dostęp do WhatsAppa i wszczęła śledztwo antymonopolowe. Bruksela egzekwuje, mimo nacisku Waszyngtonu, by odpuściła. → Gulf Stream Blues, 10.06

Polska scena AI

  • Koszt AI właśnie stał się ważniejszy od jej możliwości. Artur Kurasiński zestawił Stargate, pół biliona dolarów na infrastrukturę, z chińskim DeepSeekiem za ułamek tej kwoty i porównywalnym wynikiem. Capex bez pokrycia w przychodach to jego pytanie za 600 miliardów. → Technofobia, 11.06

  • Bez juniorów nie będzie seniorów, którzy nadzorują AI. Aleksandra Przegalińska o cichym koszcie automatyzacji ról wejściowych: jeśli AI zjada pracę juniora, za pięć lat nie ma kogo awansować na nadzorcę tej samej AI. → naTemat, 10.06

  • Dane, które wpisujesz do modelu, mogą obrócić się przeciwko tobie. Mateusz Chrobok rozłożył prompt na czynniki pierwsze jako wektor wycieku, a w osobnym materiale pokazał, jak Meta zarabia na ekosystemie scamów. → YouTube

  • Prawo i ryzyko to obszary, które prezes ignoruje, dopóki nie jest za późno. Szymon Negacz w WiseCEO o ryzyku prawnym bagatelizowanym do kryzysu. Brzmi inaczej w tygodniu, w którym rząd wyłączył komuś model. → Sellwise, 08.06

Finanse i kapitał

  • Sezon bicia milionerów. Litquidity policzył, że IPO SpaceX zrobiło około czterech tysięcy nowych milionerów wśród pracowników, a fundusz Magnetar zaczął zastępować analityków botami. → Exec Sum, 10.06

  • Koszty AI robią się trudne do ogarnięcia. CFO Brew o „podatku od AI”: budżety tokenów zjadane w dwa-trzy miesiące, 56 procent finansistów już używa AI, a i tak finanse są ostatnią funkcją we wdrożeniu. → CFO Brew, 11.06

  • Czatbot dla ludu. Tech Brew o tym, jak w Waszyngtonie pojawił się pomysł publicznego udziału w firmach AI, w tle poufnego wniosku o IPO Anthropic. Polityka zaczyna patrzeć na te firmy jak na infrastrukturę, nie jak na startupy. → Tech Brew, 08.06

Co warto przeczytać u innych

  • DeepMind martwi się o agenty, które się spotykają. Google DeepMind, Schmidt Sciences i ARIA uruchomiły fundusz 10 mln dolarów na bezpieczeństwo systemów wieloagentowych. Teza: ryzyko nie bierze się z jednego agenta, tylko z tego, co dzieje się, gdy miliony zaczynają na siebie reagować. MIT Technology Review, 11.06.

  • Najtańszy atak na agenta to grzeczna prośba. Napastnicy poprosili agenta obsługi Meta o przepięcie kont na obce maile. Agent się zgodził. Cała socjotechnika zmieściła się w jednym zdaniu do bota. MIT Technology Review, 05.06.

  • FAANG umarł, żyje MANGO (Meta, Anthropic, Nvidia, Google, OpenAI). Apple i Amazon wypadły z centrum opowieści o AI. Akronimy to zabawa, ale ten pokazuje, gdzie przesunął się środek ciężkości rynku. Fast Company.

Viral tygodnia

Dzień przydziału akcji SpaceX rozjechał się po fintechowym Twitterze i Exec Sum: zrzuty ekranu z alokacji, Jamie Dimon pitchujący akcje klientom private banking, memy o „nowych milionerach z działu HR”. Rzadki przypadek, gdy debiut giełdowy staje się treścią rozrywkową, a nie tylko notką w sekcji biznes. Sygnał dla każdego, kto buduje markę: liczby potrafią być viralem, jeśli dotykają cudzej zazdrości albo cudzego strachu. Exec Sum, 10-11.06.

Darmowy bufet kończy się tam, gdzie ktoś w końcu spojrzał na rachunek

Z laboratoriów

Modele potykają się o test, który przechodzi ośmiolatek. Klasyczny test Stroopa puszczony na GPT-5, Claude Opus 4.1 i Gemini 2.5: przy dwudziestu elementach dokładność spadała do dwunastu procent. Autorzy wskazują na architektoniczny sufit mechanizmu uwagi, nie na chwilowy błąd. Dobra szczepionka na myślenie, że skoro model zdaje egzamin prawniczy, poradzi sobie z każdym prostym zadaniem. W firmie przekłada się to wprost: zanim wpuścisz model do procesu, musisz wiedzieć, na jakim typie zadania się wykłada. ScienceDaily, 10.06.

AI zaprojektowała i przeprowadziła 36 tysięcy eksperymentów bez ludzkiej ręki. GPT-5 w połączeniu z laboratorium Ginkgo Bioworks autonomicznie zaprojektował i wykonał trzydzieści sześć tysięcy eksperymentów biologicznych. Tempo, którego ramy biobezpieczeństwa nie nadążają regulować. To samo, co cieszy w badaniach, niepokoi w nadzorze. Singularity Hub, 04.06.

World models wychodzą z konferencji do portfeli. Dwie głośne tezy tygodnia, LeCuna i Fei-Fei Li, mówią to samo (pisałem o tym już wcześniej): następny krok to modele rozumiejące fizykę świata, nie tylko język. Dla czytelnika praktyka sygnał jest skromniejszy, niż brzmi: to kierunek na lata, nie narzędzie na ten kwartał. Ale warto wiedzieć, w którą stronę idą pieniądze najtęższych głów. World Labs, 03.06.

Nie pilotaż w jednym dziale, tylko cała firma pod jednym parasolem nadzoru.

Case tygodnia

Co zadziałało: KPMG wpuściło agenty na całą firmę. 9 czerwca KPMG i Microsoft ogłosiły roll-out Microsoft 365 Copilot oraz Agent 365, warstwy do zarządzania i zabezpieczania agentów AI, w całej globalnej sieci, czyli na ponad 276 000 pracowników w 138 krajach. To nie pilotaż w jednym dziale, tylko wdrożenie na całą organizację, z governance wbudowanym od początku. Microsoft sklasyfikował KPMG jako „frontier firm”, firmę przebudowaną wokół AI. Komunikat nie podaje procentu oszczędności, więc liczbą efektu jest tu sama skala produkcyjnego wdrożenia, największego tego typu po premierze Agent 365. Lekcja: era pilotaży się kończy. Wygrywa nie ten, kto najładniej przetestuje agenty w jednym zespole, tylko ten, kto je wdroży na całą firmę i od razu obuduje nadzorem. Dla firmy doradczej, która sprzedaje zaufanie, governance nie jest dodatkiem, tylko warunkiem, żeby w ogóle ruszyć. Microsoft News, 09.06.

Darmowy bufet kończy się tam, gdzie ktoś w końcu spojrzał na rachunek

Niewypał tygodnia

Co się wywaliło: Walmart założył smycz na własne AI do kodowania. Na początku czerwca Walmart nałożył limity tokenów na wewnętrzną platformę vibe-codingu Code Puppy, z której pracownicy korzystali wcześniej bez ograniczeń. Powód: zużycie wystrzeliło, a sporą część zapytań stanowiły te same prompty powtarzane w kółko. Ten sam wzorzec widać u Amazona i Mety, które wygasiły wewnętrzne rankingi zużycia tokenów, i u Ubera, którego COO mówi, że nie ma jeszcze udowodnionego związku między liczbą zużytych tokenów a wartością. Lekcja: mierzenie sukcesu AI liczbą tokenów to jak ocenianie programisty po liczbie linii kodu. Im więcej, tym lepiej brzmi na slajdzie i tym gorzej wygląda na fakturze. Walmart nie ujawnił kwoty, ale sama zmiana z „nielimitowane” na „budżet na osobę” jest komunikatem: darmowy bufet kończy się wszędzie tam, gdzie ktoś w końcu spojrzał na rachunek. Bloomberg, 01.06.

Z Polski

Nadzór wziął AI na agendę. KNF wpisał wykorzystanie sztucznej inteligencji do priorytetów nadzorczych na 2026 i zapowiada, że sam zacznie jej używać w kontroli. W tle Europejski Bank Centralny w maju uznał ataki wspierane przez AI za systemowe ryzyko finansowe. Dla każdego, kto odpowiada za AI w regulowanej firmie, to przesuwa rozmowę z compliance na agendę zarządu, bo pytanie nadzorcy przestaje być hipotetyczne. Kiedy nadzorca sam sięga po AI do kontroli, asymetria „my testujemy, oni patrzą” znika. KNF, priorytety nadzorcze 2026.

Polski kosmos na giełdzie: fundamenty rosną, wyceny lecą w kosmos. Creotech i Scanway, dwie spółki kosmiczne na GPW, mocno zdrożały od początku roku, a komentatorzy ostrzegają, że wyceny zaczynają wyprzedzać fundamenty. W tle Polska podniosła składkę do Europejskiej Agencji Kosmicznej na lata 2026-28, kierując część wprost pod kontrakty dla krajowego przemysłu. Ten sam motyw co u Kurasińskiego: realne fundamenty i wyceny, które już ich nie pilnują. parkiet.com.

Polska wciąż liderem bankowości cyfrowej. Łatwo o tym zapomnieć w cieniu Doliny Krzemowej, ale BLIK przetworzył w 2025 roku rekordowe 2,9 miliarda transakcji, a polski sektor finansowy jest jednym z najbardziej ucyfrowionych w Unii. To realna przewaga przy wdrażaniu AI, bo proces, dane i kanał są już cyfrowe. Warunek jest jeden: nie roztrwonić jej wdrożeniami, które wyprzedzają ład i nadzór.

Benchmark tygodnia

Artificial Analysis przez kilka dni miało nowego lidera: Claude Fable 5 na szczycie indeksu jakości, powyżej Opus 4.8. Problem w tym, że lider rankingu zniknął z rynku trzy dni po premierze. To dobry moment, żeby przestać czytać te zestawienia jak listę zakupów. Ranking mówi, który model jest najzdolniejszy w laboratorium. Nie mówi, który będzie dostępny w piątek po południu, ile będzie kosztował przy twoim wolumenie i czy dostawca pozwoli trenować na twoich danych. Trzy pytania, na które żaden indeks jakości nie odpowiada, a każde waży więcej przy wdrożeniu niż miejsce w czołówce. llm-stats.com.

Liczba tygodnia

75 miliardów dolarów. Tyle pozyskał SpaceX w debiucie na giełdzie 12 czerwca, przy cenie 135 dolarów, plus 19 procent pierwszego dnia i wycenie ponad 2 biliony. Największe IPO w historii. Że to też temat AI, przypomnę: SpaceX wchłonął na początku roku xAI z modelem Grok, więc kupując akcję rakiety, kupujesz kawałek modelu językowego. CNBC, 12.06.

Dwie mniejsze liczby, które mówią równie dużo. 276 000 to pracownicy KPMG objęci jednym wdrożeniem agentów. 57,4 procent to udział ruchu agentów AI w sieci według Cloudflare, który po raz pierwszy przekroczył ruch ludzki, około 18 miesięcy wcześniej, niż prognozowano. Jeśli twoja strona miała być czytana przez ludzi, większość odwiedzin generują dziś agenty robiące coś za kogoś. Tom's Hardware, 05.06.

Kalendarz

  • ICML 2026 – 6-11 lipca, Seul. Jedna z trzech głównych konferencji uczenia maszynowego, dobry termometr kierunków badawczych. icml.cc

  • NeurIPS 2026 – 6-12 grudnia, Sydney, z satelitą w Paryżu realnie dostępną z Europy. neurips.cc

Governance w pigułce

Komisja Europejska opublikowała 10 czerwca Kodeks Praktyk ws. transparentności treści generowanych przez AI, czyli dobrowolne wsparcie wdrożenia obowiązków z artykułu 50 (oznaczanie i etykietowanie treści AI oraz deepfake'ów). Same obowiązki wchodzą 2 sierpnia 2026, ale uzgodniony w maju Digital Omnibus daje dostawcom systemów już obecnych na rynku okres przejściowy do 2 grudnia 2026. Wniosek praktyczny: nie panikuj z datą sierpniową, dla istniejących systemów realny termin to grudzień, ale proces oznaczania treści warto mieć gotowy, zanim ktoś zapyta, czy ten obrazek w kampanii był oznaczony. digital-strategy.ec.europa.eu.

Ciekawostka

14 czerwca minęło 75 lat, odkąd Biuro Spisu Ludności USA uruchomiło UNIVAC I, pierwszy komercyjny komputer w Stanach. Dostarczony przez Remington Rand, ważył ponad siedem ton, miał pięć tysięcy lamp i wykonywał około tysiąca operacji na sekundę. Rok później poprawnie przewidział wygraną Eisenhowera, gdy policzono dopiero ułamek głosów. Punkt zero podejmowania decyzji na podstawie danych zaczął się od maszyny wielkości pokoju. history.com.

Polecam: książka tygodnia

Marietje Schaake, „The Tech Coup: How to Save Democracy from Silicon Valley” (Princeton University Press, 2024). Schaake, była europosłanka, dziś w Stanford Cyber Policy Center, opisuje, jak prywatne firmy technologiczne przejęły funkcje, które kiedyś należały do państwa, od infrastruktury po decyzje o tym, kto ma dostęp do narzędzi. Czyta się to inaczej w tygodniu, w którym rząd jednym poleceniem zdjął z rynku najzdolniejszy model świata. Pytanie, kto trzyma rękę na wyłączniku, przestało być akademickie. Książka jest gęsta, bez paniki i bez technooptymizmu. press.princeton.edu.

Zdanie tygodnia

Można dziś zapłacić za najlepszy model na rynku i w piątek zostać z niczym, bo wyłączył go ktoś, kto nawet nie był stroną twojej umowy.

Na koniec

To pierwszy numer i wiem, że nie wszystko jest w nim idealne. Odpiszcie mi, co zostawić, co wyciąć, czego brakuje. Do następnej środy.

Bartosz

PS. Jeśli ten numer trafił do Ciebie od kogoś i chcesz dostawać kolejne, daj znać.

Reply

Avatar

or to participate

Keep Reading