This website uses cookies

Read our Privacy policy and Terms of use for more information.

Trzy różne ręce na tym samym kurku.

W trzech zdaniach

  • Najlepszy model wciąż jest wyłączony decyzją rządu USA, a Microsoft i Uber zaczęli racjonować AI licznikiem tokenów i firmowym budżetem. O tym, co możesz z AI zrobić, decyduje teraz dostęp, nie sam model.

  • Zakaz na amerykański Fable wypchnął na szczyt chiński, otwarty GLM-5.2, który robi prawie to samo za ułamek ceny. Kontrola eksportu zadziałała jak darmowa reklama konkurenta.

  • Bank Światowy wycenił AI dla Polski na nawet plus dwanaście procent PKB do 2035 roku, a Sejm uchwalił ustawę o AI. Krajowa stawka i nadzór przestały być rozmową hipotetyczną.

Otwarcie

W tym tygodniu Zachód nie wypuścił żadnego nowego flagowca. Informacje o GPT-5.6 krążą po sieci jako przeciek z OpenAI, ale nikt oficjalnie go nie ogłosił. Gemini 3.5 Flash wszedł w maju, a Pro wciąż czeka na premierę. A najlepszy model, jaki ktokolwiek istniał pokazał się w czerwcu, ale Claude Fable 5, bo o nim mowa, jest już dwunasty dzień wyłączony, bo rząd USA kazał go odłączyć. Nie znamy terminu powrotu.

Skoro nie ma o czym pisać w rubryce „premiery”, popatrzmy, co naprawdę ruszyło się w tym tygodniu. Nie możliwości modeli, tylko dostęp do nich. Rząd racjonuje przez kontrolę eksportu, bo Waszyngton odłączył Fable jednym pismem o 17:21. Dostawca przez licznik tokenów, bo Microsoft wypuścił Copilot Cowork z rozliczeniem za zużycie, a nie w ryczałcie. Firma przez budżet, który pracownik przepala do połowy roku, bo Uber wprowadził limity, gdy roczna pula skończyła się w kwietniu. Trzy różne ręce na tym samym kurku.

W tym numerze raz po raz wraca jedna firma, Anthropic. W ciągu jednego tygodnia jej najlepszy model wyłączył rząd, ona sama podkupiła od Google’a noblistę od AlphaFold, a na dokładkę ogłosiła umowę, która wpuści Claude do banków w pięćdziesięciu sześciu krajach. Naraz ofiara zakazu, łowca talentów i dostawca wchodzący do regulowanego świata. Dostęp do najlepszego AI jest więc dziś jednocześnie aktywem, towarem na kartki i ryzykiem regulacyjnym. Dla zarządu pytanie przestało brzmieć „jak dobry jest model”. Zaczęło brzmieć: kto decyduje, czy wolno mi go uruchomić, ile mnie kosztuje token i kto odpowiada, gdy się pomyli.

W tle siedzi liczba, która powinna studzić każdy entuzjazm. Tylko szesnastu na stu Amerykanów wierzy, że AI wyjdzie społeczeństwu na dobre, choć prawie połowa używa chatbotów codziennie. Mamy więc technologię masowo używaną i masowo nielubianą naraz, wpuszczaną do firm szybciej, niż ktokolwiek zdążył policzyć jej koszt i ułożyć zasady dostępu. Ten numer jest o tym, kto te zasady właśnie pisze. A pisze je w pięciu miejscach naraz, bez koordynacji. Pierwszy raz od dawna najważniejsze pytanie w AI nie zaczyna się od słowa „jak”, tylko od słowa „kto”.

Premiery

Zakaz na jeden model zadziałał jak darmowa reklama drugiego.

GLM-5.2 (Z.ai, dawne Zhipu) – 17 czerwca, otwarte wagi na licencji MIT, 753 miliardy parametrów, okno miliona tokenów. Na SWE-bench Pro robi 62,1 punktu przeciw 58,6 GPT-5.5, na FrontierSWE 74,4 procent przeciw 72,6, o włos za Claude Opus 4.8 (75,1). Wszystko przy mniej więcej jednej szóstej kosztu. To pierwszy chiński model, który realnie depcze po piętach amerykańskiej czołówce w kodzie, i robi to za grosze. Tu jest zresztą ironia tygodnia: zakaz na amerykański model zadziałał jak darmowa kampania chińskiego, bo skok GLM-5.2 w rankingach przyszedł dokładnie w tygodniu, gdy Fable poszedł offline. Werdykt: dla zespołu inżynierskiego to kandydat do pilotażu już dziś, dla sektora regulowanego dopiero początek rozmowy o tym, skąd pochodzą wagi, na jakiej licencji wolno je odpalić i gdzie je trzymać. VentureBeat

Kimi K2.7 Code (Moonshot AI) – 12 czerwca, otwarte wagi na zmodyfikowanej licencji MIT, bilion parametrów w architekturze MoE (aktywnych 32 miliardy), okno 262 tysięcy tokenów, 30 procent mniej tokenów na rozumowanie niż poprzednik, cena 0,95 i 4,00 dolara za milion tokenów. Werdykt: tani i otwarty, do długich zadań koderskich, ale benchmarki są wyłącznie od producenta, bez zgłoszenia do niezależnego rankingu, więc liczby traktuj jak deklarację marketingową, nie jak pomiar. Razem z GLM-5.2 i MiniMax-M3 to już fala. Tanie chińskie modele z otwartymi wagami wchodzą tam, gdzie rok temu trzeba było płacić za API z San Francisco. Crypto Briefing

GPT-5.6 – na razie tylko przeciek, nie premiera. Użytkownicy ChatGPT Pro raportują działający, wyraźnie szybszy model, główny naukowiec OpenAI mówi o „znaczącym skoku”, a rynek predykcyjny wyceniał na 83 procent wejście w oknie od 22 do 28 czerwca. Do czasu oficjalnego komunikatu i karty modelu to dla mnie plotka z dobrymi referencjami, nie fakt, i tak ją tu trzymam. Gdyby weszła, timing byłby bezczelny, bo OpenAI wbiłoby premierę w lukę po wyłączonym rozporządzeniem Fable. TechTimes

Korekta dla porządku, bo agregatory się mylą. Fable 5 nie „wraca na kredyty”, jak zapowiadał komunikat z 9 czerwca. Od 12 czerwca jest zablokowany nakazem kontroli eksportu i pozostaje wyłączony dla wszystkich, bez terminu. Pierwotny plan przejścia z subskrypcji na model kredytowy z 23 czerwca umarł, zanim wszedł w życie. Pozostałe modele Anthropic, w tym Opus 4.8, działają normalnie. Anthropic

Narzędzie tygodnia

Microsoft Copilot Cowork – od 16 czerwca w pełnej dostępności na świecie, po trzech miesiącach fazy testowej, w której używała go już ponad połowa firm z listy Fortune 500. To agent, któremu się deleguje całe wielokrokowe zadanie, a nie tylko zadaje pytanie: analiza konkurencji z arkusza, rozwiązanie konfliktu w kalendarzu z kontekstem ze skrzynki. Firma odeszła od subskrypcji jak do tej pory i wprowadziła licznik (Copilot Credits, jeden cent za kredyt, koszt liczony od użytego modelu, pobranego kontekstu, wywołań narzędzi i czasu pracy). W praktyce „delegowanie” znaczy tu, że zlecasz agentowi zadanie, a on sam decyduje, ile modeli i wywołań po drodze odpali. Ile cię to kosztowało, dowiadujesz się z rachunku. Brzmi wygodnie. Rachunek przychodzi później. Werdykt: warto przetestować pod realne zlecanie pracy, ale zanim wpuścisz to do banku, policz koszt jednego zadania i ustaw twardy limit na zespół, bo agent bez bramki budżetowej potrafi zjeść roczną pulę do kwietnia, o czym za chwilę przy Uberze. Kto woli trzymać dane u siebie, ten odpali tani otwarty model na własnym serwerze (GLM-5.2, Kimi K2.7) i zapłaci za prąd i moc obliczeniową zamiast za każdy token. Microsoft

Co mówią liderzy

Pierwszy raz firma tej skali nazwała AI po imieniu w dokumencie dla nadzoru.

Na świecie · Modele z czołówki to dziś sprawa polityki zagranicznej – na zamkniętym lunchu G7 w Évian Dario Amodei i Demis Hassabis wezwali do koalicji AI pod wodzą USA, z kontrolowanym dostępem do najmocniejszych modeli i handlem chipami z wykluczeniem Chin. Sam Altman proponował globalne forum testowania ze wspólnymi standardami bezpieczeństwa. Tuż przed szczytem rząd odłączył Fable dla cudzoziemców. → CNBC

Wojna o talent · Anthropic przyciąga najlepszych, a Google ich traci – John Jumper, noblista i współtwórca AlphaFold, odchodzi z Google DeepMind do Anthropic po blisko dziewięciu latach. Kilka dni wcześniej współlider Gemini Noam Shazeer przeszedł do OpenAI, a jeszcze wcześniej do Anthropic trafił Andrej Karpathy. Z koronnego klejnotu AI Google wycieka talent w tygodniu. Ruch jest świeży, oparty na komunikacie i wpisie Hassabisa, więc traktuję go jako potwierdzony, ale wciąż gorący. → TechCrunch

Na świecie · Automatyzuj to, co da się sprawdzić – Andrej Karpathy nazwał to „Software 3.0”. Modele warto kierować do zadań, których poprawność można zweryfikować twardym testem, wynikiem gry albo automatycznym sprawdzaczem. To najlepsza heurystyka doboru zastosowań AI w banku, jaką słyszałem w tym roku tygodniu :): stawiaj przy zadaniach, w których da się postawić obiektywny test poprawności. Efektowne demo zostaw na konferencje. → karpathy.bearblog.dev

Na świecie, ostrzej · Moc obliczeniowa to być albo nie być – Yann LeCun nazwał xAI „kind of a failure”, czyli mniej więcej „poniekąd porażką”, twierdząc, że lab nie utrzyma się na froncie, skoro musi wydzierżawiać moc obliczeniową rywalom, w tym Anthropic. Spór „world models kontra LLM” przestaje być akademicki i robi się walką o kapitał i ludzi. → Wall Street Pit

Na świecie · Z czarodzieja w mecenasa – Ethan Mollick opisał pracę z modelem klasy Mythos jako przejście od „rzucania zaklęcia” do „opisania celu i oceny rezultatu”. Model sam zlecał tańsze podmodele i przez wielogodzinną sesję sprawdzał własną pracę. To dokładnie ten tryb, w którym agent robi coraz więcej poza zasięgiem wzroku operatora, więc logowanie i nadzór człowieka trzeba projektować od samego początku, a nie doklejać, gdy coś już pójdzie nie tak. → Boing Boing

Polska scena AI · Najmocniejszy studzący głos trzyma widoczność – Aleksandra Przegalińska odebrała nagrodę „Internationalization Stars 2026” za wykorzystanie AI w umiędzynarodowieniu uczelni i dalej raczej tonuje technologiczne lęki, niż je podkręca. To wartościowy punkt odniesienia, kiedy w firmie trzeba spokojnie rozmawiać o adopcji AI, bez histerii w żadną stronę. → Akademia Leona Koźmińskiego

Finanse i kapitał · Wyścig na giełdę przy rosnącym rachunku za tokeny – OpenAI przygotowuje poufne złożenie wniosku o IPO, możliwy wrzesień, wycena prywatna rzędu 730 miliardów dolarów. Anthropic ma już poufne S-1. Altman przyznaje przy tym, że koszt tokenów to „huge issue”, czyli poważny problem, bo jego najwięksi użytkownicy zużywają po sto miliardów tokenów miesięcznie. Ten koszt rośnie razem ze skalą i jest realnym ryzykiem budżetowym każdego poważnego wdrożenia. → Axios

Regulacja i kapitał · W USA o kształcie reguł AI decyduje też budżet reklamowy – super-PAC „Leading the Future”, zasilony między innymi przez fundusz Andreessen Horowitz i współzałożyciela OpenAI Grega Brockmana, zebrał ponad 75 milionów dolarów na kampanie przeciw ostrzejszym regulacjom AI. Anthropic dorzucił 20 milionów po przeciwnej stronie. Obie firmy szykują się do wejścia na giełdę. Dla kogoś, kto pracuje z AI Act, to ostry kontrast dwóch światów: w Europie reguły pisze rozporządzenie, w USA coraz częściej spot wyborczy. → NPR

Branże regulowane · Dostawcy ustawiają się pod banki – Anthropic ogłosił umowę z TCS, które wdroży Claude u 50 tysięcy własnych pracowników w 56 krajach i będzie budować produkty dla finansów, ochrony zdrowia i sektora publicznego. Dla decydenta w banku to sygnał, że wybór dostawcy AI przestaje być zakupem licencji, a robi się wyborem całego łańcucha integracji i partnera, który już zna regulowany świat. → Anthropic

Na świecie · Jesteśmy w podnóżach osobliwości – Demis Hassabis na Stanford GSB powtórzył, że AGI to horyzont 2029 do 2030, i nazwał obecny moment „podnóżami osobliwości”. Niezależnie od tego, czy się z tą datą zgadzasz, warto czytać ją jak deklarację tempa konkurenta, nie jak wróżbę. Tak właśnie Google ustawia sobie zegar. → Stanford GSB

Rynek pracy · Pierwszy raz firma tej skali nazywa AI po imieniu w dokumencie dla SEC – Oracle wpisał do rocznego sprawozdania, że „wdrożenie technologii AI w naszych operacjach doprowadziło i może dalej prowadzić do redukcji zatrudnienia”. Załoga skurczyła się o 21 tysięcy osób w rok, ze 162 do 141 tysięcy, a koszt odpraw skoczył do 1,84 miliarda dolarów z 374 milionów rok wcześniej. Lekcja dla decydenta nie brzmi „AI tnie etaty”. Brzmi raczej: naucz się odróżniać automatyzację, która naprawdę zabiera pracę, od zwykłej restrukturyzacji, która dostała wygodniejszą etykietę. Bo „przez AI” to dziś najwygodniejsze zdanie w komunikatach prasowych. → CNBC

Co warto przeczytać u innych

  • Interfejsy mózg-komputer wchodzą w fazę prób klinicznych – liczba pacjentów z implantami rośnie, ośrodki przechodzą do prób pivotalnych pod nadzorem FDA, a Chiny pierwsze dopuściły takie urządzenie do użytku medycznego poza badaniem. To jakościowo nowy etap, daleko od kolejnego dema z laboratorium. MIT Technology Review

  • Rosyjska sieć Pravda zatruwa chatboty – audyt NewsGuard pokazał, że Mistral Le Chat powtarza rosyjskie fałsze mniej więcej w połowie odpowiedzi, a spośród testowanych modeli najlepiej wypadł Claude. Pravda to setki witryn zalewających wyniki wyszukiwania i modele propagandą zoptymalizowaną pod indeksowanie. Model uczy się z objętości, nie z prawdy, więc jeśli budujesz wyszukiwanie po własnych dokumentach, pilnuj, skąd bierze źródła. NewsGuard

  • Estonia nadaje agentom AI numery jak PESEL – pierwszy kraj, który chce dać każdemu agentowi własną tożsamość z zawężonymi uprawnieniami, żeby dało się sprawdzić, co agent może zrobić, kto za nim stoi i czy wolno mu na przykład tylko czytać dane, czy też wykonać przelew do określonego limitu. Takiego precedensu prawnego nikt jeszcze nie próbował na tę skalę. The Register

  • Qualcomm chce kupić Tenstorrent za 8 do 10 miliardów dolarów – firma Jima Kellera projektuje akceleratory AI na otwartym standardzie RISC-V, a takie przejęcie dałoby Qualcommowi realne wejście do centrów danych, gdzie dziś rządzi Nvidia ze swoim zamkniętym CUDA. Stawką jest, czy otwarty standard zrobi w AI to samo, co Linux zrobił kiedyś na serwerach. Tom's Hardware

  • Geoinżynieria dostaje zimny prysznic – słoneczna geoinżynieria wychodzi z symulacji w fazę zwykłych problemów inżynierskich i okazuje się, że samoloty zdolne dostarczyć aerozole na właściwą wysokość po prostu nie istnieją. Tekst spokojnie wymienia, czego technicznie brakuje, zamiast po raz setny debatować, czy w ogóle powinniśmy. Dobra lekcja o przepaści między obietnicą a infrastrukturą, którą trzeba dopiero zbudować. MIT Technology Review

  • Precyzyjna edycja genów w ludzkich embrionach i powrót debaty o „dzieciach na zamówienie” – zespół z Columbia użył base editingu, dokładniejszego od klasycznego CRISPR, do zmiany trzech genów powiązanych z chorobami we wczesnych embrionach. Eksperyment nie miał prowadzić do ciąż, ale i tak natychmiast podzielił środowisko, bo granica między „naprawianiem chorób” a „projektowaniem ludzi” robi się coraz cieńsza. Singularity Hub

  • Meta po cichu schowała rozpoznawanie twarzy w okularach, aż ktoś to znalazł – w aplikacji Ray-Ban Meta siedziała ukryta funkcja zamieniająca twarze w odciski biometryczne i porównująca je z bazą, zainstalowana na milionach telefonów bez słowa komunikatu. Po publicznym nacisku firma usunęła ten kod w dobę. Niezła ilustracja, jak daleko potrafi zajść biometria, zanim ktokolwiek zapyta o zgodę. EFF

  • Korea Południowa idzie po miejsce w pierwszej trójce AI obok USA i Chin – prezydent ogłosił wieloletni plan, kraj uchwalił własną ustawę ramową o AI jako jeden z pierwszych po UE, a SKT prowadzi konsorcjum budujące suwerenny model. To państwo, które traktuje AI nie jak sektor, lecz jak strategię narodową, i ciekawy kontrapunkt dla polskiej debaty o tym samym. MIT Technology Review

Viral tygodnia

Skutek uboczny zakazu – w tym samym tygodniu, w którym rząd USA trzymał Fable wyłączony „dla ochrony przewagi”, chiński, otwarty GLM-5.2 wyprzedził GPT-5.5 i deptał po piętach najlepszemu amerykańskiemu modelowi, którego nikt nie mógł odpalić. Branżowy Twitter rozegrał to jako podręcznikowy paradoks sankcji: blokada napędza rywala. Kontrola eksportu zrobiła konkurentowi kampanię, za którą nikt nie zapłacił. VentureBeat

„Pichai mówi 75 procent, inżynierowie rysują memy” – wewnętrzny serwis z memami w Google zalał się żartami, że firmowe narzędzia AI są do bani, w tym samym czasie, gdy Sundar Pichai chwali się publicznie, że trzy czwarte nowego kodu w firmie pisze AI. Rozejście się tych dwóch obrazków po 404 Media, Hacker News i X potwierdza zasięg. To najczystsza ilustracja luki, którą widzę w co drugim wdrożeniu: adopcja mierzona slajdem zarządu i adopcja mierzona zespołem to dwa różne raporty, a ten drugi rzadziej trafia na konferencję. Prawdziwa miara to nie procent kodu z modelu, tylko moment, w którym zespół przestaje z niego szydzić. 404 Media

Z laboratoriów

Mythos 5 napisał własny model i pobił publikację z „Science” – w ponad tydzień w dużej mierze samodzielnej pracy model złożył dane jednokomórkowe dla milionów komórek z 138 gatunków, zaprojektował i wytrenował własny system uczenia maszynowego, a ten pobił model opublikowany w „Science”, będąc sto razy mniejszym. Robił to wariant tego samego modelu, który dziś jest zablokowany. Trudno o lepszą ilustrację, czym się ryzykuje, gdy najlepsze narzędzie naukowe można odłączyć rozporządzeniem. Anthropic

OpenAI testuje modele w cieniu prawdziwych rozmów – nowa metoda „deployment simulation” bierze 1,3 miliona zanonimizowanych rozmów z serii GPT-5, usuwa oryginalne odpowiedzi i puszcza te same zapytania przez nowy model kandydujący, a wynik sprawdza pod kątem dwudziestu typów niepożądanych zachowań. To krok od testowania w piaskownicy do próby generalnej na realistycznych danych. Gotowy wzorzec dla każdego, kto buduje walidację modeli przed wdrożeniem. OpenAI

DeepMind dokłada 10 milionów dolarów na bezpieczeństwo wieloagentowe – razem ze Schmidt Sciences i ARIA, na badania nad tym, co się dzieje, gdy populacje samodzielnych agentów zaczynają działać razem. Kontekst jest niepokojący: na niektórych rynkach agenty już przegoniły ludzkich traderów w wolumenie, a nikt nie umie przewidzieć, co się stanie, gdy zaczną negocjować między sobą bez ludzkich reguł. Dla banku, który myśli o agentach w procesach, to przypomnienie, że najtrudniejsze ryzyko powstaje dopiero wtedy, gdy kilka agentów zaczyna na siebie wzajemnie wpływać. DeepMind

Startup twierdzi, że obszedł wąskie gardło długiego kontekstu – Subquadratic pokazał architekturę, która ma przetwarzać do dwunastu razy więcej tekstu naraz przy niższym zużyciu prądu, analizując tylko najważniejsze fragmenty zamiast wszystkiego po kolei. Jeśli te liczby potwierdzą się niezależnie, zmienia się ekonomia czytania setek dokumentów albo całych baz kodu. Na razie to deklaracja firmy, nie pomiar, więc trzymam przy niej znak zapytania. MIT Technology Review via Singularity Hub

AI zaprojektowała uniwersalną szczepionkę, która przeszła pierwszą próbę na ludziach – zespół z University of Cambridge i jego spółka DIOSynVax użyli uczenia maszynowego, żeby zaprojektować syntetyczny „super-antygen” celujący w cechy wspólne dla całej rodziny koronawirusów Sarbeco. Szczepionka pEVAC-PS, pierwsza, której aktywny składnik w całości zaprojektował komputer, przeszła pierwszą fazę na 39 ochotnikach, okazała się bezpieczna i wywołała odpowiedź odpornościową na SARS-CoV-2, SARS, a także na pokrewne wirusy nietoperzy, które dopiero mogą przeskoczyć na ludzi. To drugi w tym numerze przypadek, gdy AI projektuje konkretną cząsteczkę i ta cząsteczka działa na ludziach. University of Cambridge

Case tygodnia

Pierwszy chemik z AI, który doszedł do prawdziwej probówki. Człowiek wciąż przy stole.

Molecule.one z OpenAI postawili pierwszego chemika z AI, który doszedł do prawdziwego laboratorium. GPT-5.4 z systemem Maria prawie samodzielnie wybrał problem, wygenerował i ocenił hipotezy, a laboratorium przeprowadziło 10 080 reakcji w trzy miesiące, poprawiając sprzężenie Chan-Lam, ważne w chemii leków. To pierwszy publicznie udokumentowany przypadek, gdy model z czołówki prowadzi otwarty problem chemiczny od literatury aż po próbę w probówce, z chemikiem cały czas w pętli. Liczba efektu jest tu twarda i mierzalna, nie „rewolucyjna”: jedna konkretna reakcja, realnie poprawiona, w realnym laboratorium. To zarazem polski wkład w światową naukę z AI, bo Molecule.one to warszawski zespół. Z tego jednego przykładu każdy wyciągnie coś swojego. Dla wdrożeniowca to dowód, że model wpuszczasz tam, gdzie wynik da się zmierzyć w laboratorium, a nie na slajdzie. Dla zespołu technicznego, że człowiek wciąż waliduje końcowy efekt. Dla zarządu, że przewaga rodzi się na styku modelu i własnego procesu, którego konkurent nie ma. TechTimes

Dla skali, jak to samo wygląda po stronie banku. JPMorgan księguje AI jak infrastrukturę krytyczną, obok systemów płatniczych i kontroli ryzyka, w budżecie technologicznym rzędu 17 miliardów dolarów, z narzędziami AI udostępnionymi mniej więcej 60 tysiącom pracowników. To decyzja sprzed tego tygodnia, ale dobry punkt odniesienia. Gdy systemowo ważny bank traktuje AI jak szyny płatnicze, a nie jak laboratorium, polski bank trzymający AI w budżecie projektowym dostaje konkretne pytanie na najbliższy przegląd: czy to wciąż eksperyment, który można zamknąć, czy system, bez którego nie chce już działać. Bo za tymi dwiema odpowiedziami stoją dwie różne polityki bezpieczeństwa, dwa różne budżety i dwie różne rozmowy z nadzorem. Banking Exchange

Niewypał tygodnia

Koń trojański z fałszywych zgłoszeń błędów, którego agent sam wciąga do środka.

Agentjacking: jeden fałszywy raport błędu przejmuje twojego agenta koderskiego. Tenet Security pokazał nową klasę ataku. Napastnik wstrzykuje spreparowane zgłoszenia błędów do Sentry przez publiczny klucz, serwer Sentry podaje je agentowi koderskiemu jako prawdziwe błędy do naprawy, a agent wykonuje „kroki naprawcze”, czyli w rzeczywistości złośliwą komendę, z uprawnieniami użytkownika. Skuteczność 85 procent na Claude Code, Cursorze i Codeksie, 2388 organizacji z podatnym kluczem, w tym jedna firma z Fortune 500. Atak omija zapory, kontrole dostępu i VPN, bo każda akcja w łańcuchu jest formalnie autoryzowana. Żadnego włamania, żadnego alarmu. Tenet nazywa to łańcuchem autoryzowanej intencji: cały model bezpieczeństwa wyłapuje działania nieautoryzowane, a tu nie ma żadnego, są tylko zatrute dane wejściowe, które agent wykonuje w dobrej wierze. Sentry uznał problem i odmówił naprawy u źródła, uznając tę klasę ataku za „technicznie nie do obrony” na poziomie platformy. Morał jest prosty. Autonomia agenta na niezaufanym wejściu, bez człowieka przy bramce, to nie innowacja, tylko otwarte drzwi z napisem „wejdź i wykonaj”. Dla banku, który właśnie wpuszcza agenty do utrzymania kodu i obsługi zgłoszeń, to gotowy argument za kontrolą wejścia i wyjścia agenta oraz logowaniem każdej akcji, zanim ktoś udowodni na produkcji, że ta bramka była potrzebna. The Hacker News

Z Polski

Ten sam kraj, dziesięciokrotna różnica. Wszystko zależy od tego, którą drogą.

Bank Światowy policzył AI dla polskiej gospodarki. W raporcie „Navigating the Age of AI: Implications for Poland's Economy” z 22 czerwca AI może podnieść realne PKB Polski o od 1,3 do 12,1 procent do 2035 roku, w zależności od tempa inwestycji firm i mobilności pracowników. To pierwsze zastosowanie nowego modelu makroekonomicznego MANAGE-AI do konkretnego kraju. Dziesięciokrotna różnica między scenariuszem słabym a mocnym to nie prognoza, tylko lista zadań domowych: kapitał na inwestycje, otoczenie sprzyjające innowacji i rynek pracy, który pozwala ludziom przejść do nowych ról. Rzadko czytam dokument, który mówi o AI w Polsce językiem PKB i etatów, a nie slajdów, więc ten zapisuję sobie do cytowania. Bank Światowy

Sejm uchwalił ustawę o systemach sztucznej inteligencji (421 za, 3 przeciw, 18 wstrzymujących). Powstaje Komisja ds. Rozwoju i Bezpieczeństwa AI jako krajowy nadzór rynku i pojedynczy punkt kontaktu z UE, z prawem między innymi do wycofania z rynku niebezpiecznego systemu. Co najmniej jedna piaskownica regulacyjna ma ruszyć do 2 sierpnia, dla małych i średnich firm bezpłatnie, dla dużych za jednorazową opłatą. Dla każdego, kto wdraża AI w regulowanym sektorze w Polsce, to konkret, nie zapowiedź. Krajowy nadzór dostaje twarz i kompetencje przed wakacjami, a piaskownica daje kontrolowane miejsce na test, zanim system wejdzie na rynek. Najmocniejszy polski wątek tygodnia, czyli chemik z AI z Molecule.one, awansował zresztą do Case tygodnia powyżej. Rzeczpospolita

Polski sektor kosmiczny łapie falę po wejściu SpaceX na giełdę. W dniu debiutu na Nasdaq Creotech urósł o 13 procent, Scanway o ponad 4. To efekt nastroju, nie fundamentów, ale dorobek rośnie naprawdę. Sener Polska dostarczy systemy dokowania dla europejskiego statku towarowego Nyx, konstelacja PIAST potwierdziła pełną sprawność i przesłała kolejne zdjęcia z orbity, a w środę w Poznaniu sektor zbiera się na Forum, żeby ustalić, kto zagospodaruje rekordową składkę do ESA. Technologia jednocześnie cywilna i wojskowa przestaje tu być wyjątkiem i staje się kategorią domyślną. To jeden z niewielu obszarów, w których polski zaawansowany przemysł realnie dostarcza sprzęt i kontrakty, a nie same zapowiedzi. Parkiet

Benchmark tygodnia

Na koderskich rankingach SWE-bench Pro i FrontierSWE otwarty GLM-5.2 wyprzedził GPT-5.5 i tylko o włos ustępuje Opusowi 4.8, przy mniej więcej jednej szóstej kosztu. Ale to decyzja, nie liczba. Ranking mówi, że za ułamek ceny masz model na granicy czołówki, tyle że mierzy laboratorium, a nie to, co naprawdę decyduje w banku: skąd pochodzą wagi, na jakiej licencji wolno je odpalić, czy trzymasz model u siebie, czy oddajesz dane na zewnątrz, i czy dostawca utrzyma go jeszcze za rok. Ranking jest dobrym powodem, żeby zacząć rozmowę, i fatalnym, żeby ją zakończyć. Dochodzi do tego rzecz, której żaden z tych benchmarków nie mierzy. Czy ktoś ci tego modelu nie wyłączy, jak wyłączono Fable, i czy za rok będzie go jeszcze kto utrzymywać. W regulowanym sektorze trwałość dostawcy i prawo do uruchomienia ważą więcej niż dwa punkty na liście, której i tak nikt z zarządu nie czyta. VentureBeat

Liczby tygodnia

46,4 procent. Tyle wynosi udział ChatGPT w rynku asystentów na koniec maja, pierwszy raz poniżej połowy. Gemini ma 27,7 procent, Claude 10,3. ChatGPT wciąż przekroczył 1,1 miliarda użytkowników miesięcznie, więc to nie zapaść, tylko koniec ery jednego asystenta. Liczba użytkowników to próżność, a rachunek robi się z konwersji, i rynek przesuwa się powoli z chatbota na agenta. TechCrunch

1500 dolarów miesięcznie. Tyle wynosi nowy limit wydatków na tokeny na pracownika w Uberze, po tym jak firma przepaliła cały budżet AI na 2026 już w kwietniu, jak ujawnił Financial Times. Racjonowanie AI weszło do wnętrza firm, zanim trafiło do większości polityk, bo rozliczenie za tokeny zamieniło płaską subskrypcję w licznik, który tyka przy każdym podzadaniu agenta. Crypto Briefing

16 procent. Tylu Amerykanów wierzy, że AI wpłynie pozytywnie na społeczeństwo, przy 49 procentach, którzy już używają chatbotów. Masowa adopcja przy masowej nieufności to nowy, niewygodny stan domyślny, jakiego nie znała żadna wcześniejsza powszechna technologia. Pew Research

3,6 oraz 22 miliardy dolarów. Tyle zapłacili kolejno Salesforce za Fin, agenty do obsługi klienta, formalnie dawny Intercom, i Fox za Roku. Pierwsze to defensywne przejęcie firmy, która straciła w tym roku część wartości na strachu, że agenty zjedzą klasyczny system obsługi klienta. Drugie to zakład, że w erze treści tworzonych przez AI o przewadze decyduje kontrola dystrybucji i danych o widzu, a nie sam katalog. Gdy gigant płaci miliardy za młodszego gracza, często nie kupuje wzrostu, tylko spokój, że to nie tamten go zastąpi. Salesforce · Fox Business

Kalendarz

  • Forum Sektora Kosmicznego (V edycja) – 24 czerwca, Poznań. Sektor ustala, kto zagospodaruje rekordową składkę do ESA. link

  • ICML 2026 – 6 do 11 lipca, Seul. Główna światowa konferencja uczenia maszynowego. link

  • Responsible AI Summit 2026 – 21 do 22 września, lokalizacja do potwierdzenia. Wdrożenia governance na żywych przykładach. link

  • AI-CONNECT Szczecin – 23 września. Największa konferencja AI na Pomorzu Zachodnim. link

  • AI Summit Poland – 8 października, Warszawa. Format pod kadrę zarządzającą, mocne kontakty. link

Governance w pigułce

Właściciel modelu odpowiada za to, co model powie. Niemiecki sąd krajowy uznał, że Google odpowiada za fałszywe twierdzenia w swoich podsumowaniach AI, bo to nie lista cudzych źródeł, tylko nowa treść tworzona przez firmę. Google się odwołuje. Dla banku to praktyczny argument za logowaniem odpowiedzi, człowiekiem w pętli i prawem klienta do wyjaśnienia. Zanim podobny spór trafi do banku, gdzie w grze jest decyzja kredytowa, a stawka jest dużo wyższa niż przy podsumowaniu w wyszukiwarce. the decoder

Ciekawostka

23 czerwca to urodziny Alana Turinga. Jego test pytał, czy maszyna potrafi udawać człowieka. W 2026 odwróciliśmy to pytanie i codziennie sprawdzamy, czy to człowiek napisał tekst, podpisał kod i przejrzał dokument. Sto czternaście lat, a pytanie Turinga wciąż zdaje egzamin, tylko że z drugiej strony lustra.

To także tydzień urodzin Andrzeja Sapkowskiego. Pisarz sprzedał CD Projektowi prawa do gier o Wiedźminie za jednorazowe 35 tysięcy złotych, bo uznał gry za „niszowe medium”. Na tej licencji zbudowano potem biznes liczony w miliardach. Najlepsza możliwa przypowieść na tydzień, w którym wszyscy liczą wartość modeli, danych i dostępu. Jeśli sam nie wiesz, ile wart jest twój aktyw, ktoś inny policzy to za ciebie i wyceni po swojej stronie stołu.

Polecam

Chris Miller, „Wielka wojna o chipy. Jak USA i Chiny walczą o technologiczną dominację nad światem” (Prześwity, 2023). Jeśli z tego numeru wynika jedno zdanie, to takie, że wojna o AI przeniosła się z benchmarków na kontrolę dostępu, a kontrola dostępu zaczyna się od krzemu. Miller pokazuje, jak przez pół wieku przewagę technologiczną wygrywało się i przegrywało przez to, kto produkuje chipy i komu wolno je kupić. Po tej lekturze zakaz na Fable, rozmowy Qualcomma o przejęciu Tenstorrent i to, że chiński GLM-5.2 urósł mimo blokad, układają się w jeden stary wzorzec, który powtarza się od czasów embarga na maszyny do produkcji układów. Lepszego kontekstu do zrozumienia, czemu „kto ma dostęp do mocy obliczeniowej” jest dziś ważniejsze od „kto ma najlepszy model”, nie znajdę. Simon & Schuster

Zdanie tygodnia

W 2026 nie wygrywa ten, kto ma najlepszy model, tylko ten, kto kontroluje dostęp do niego: rząd przez eksport, dostawca przez licznik tokenów, a regulator przez odpowiedzialność za błąd.

Domknięcie

Jeśli planujesz w tym roku wpuścić agenty głębiej niż do pilotażu, dwie rzeczy z tego numeru warto policzyć wcześniej niż później. Koszt jednego zadania i to, kto siedzi przy bramce między niezaufanym wejściem a wykonaniem. Resztę rynek wyceni za ciebie, zwykle drożej, niż zakładałeś.

PS. Jutro w Poznaniu Forum Sektora Kosmicznego ustala, kto zagospodaruje rekordową składkę Polski do ESA. Jeśli ktoś z Was tam będzie, dajcie znać, jak rozłożyły się akcenty, bo to jeden z niewielu polskich stołów, przy których najnowsza technologia spotyka realny budżet.

Bartosz

Newsletter Bartosza Sokolińskiego – co środa.

Reply

Avatar

or to participate

Keep Reading