20 lipca, 2025

Agenci “przepierający” dane – narastający kłopot i wielkie rozczarowanie AI

Agenci “przepierający” dane – narastający kłopot i wielkie rozczarowanie AI

„`html

Tak zwana agentowa sztuczna inteligencja, czyli wyspecjalizowane narzędzia przygotowane do realizacji konkretnych zadań, zapowiadana była jako technologia, która zrewolucjonizuje funkcjonowanie firm oraz instytucji. Obecnie jednak, mimo dużych oczekiwań, tego typu systemy mierzą się z wieloma problemami i rozczarowaniami. Wśród kluczowych trudności branża wskazuje na zalew rynku przez fałszywych agentów – czyli produkty imitujące profesjonalną agentową AI, a także na słabą skuteczność prawdziwych rozwiązań agentowych.

Rozczarowująca wydajność agentów AI

Najnowsze badania wykazują, że agenty AI kiepsko radzą sobie z typowymi zadaniami biurowymi – w około 70% przypadków wykonują je niepoprawnie. Badacze z Carnegie Mellon University zaprojektowali środowisko testowe TheAgentCompany do weryfikacji, jak systemy AI przeprowadzają różnorodne zadania, takie jak przeszukiwanie stron www, kodowanie, uruchamianie aplikacji czy komunikacja zespołowa. Wyniki testów ujawniły słabości czołowych modeli językowych:

  • Gemini-2.5-Pro – skuteczność nieco powyżej 30%
  • Claude-3.7-Sonet – ok. 26% skuteczności
  • Claude-3.5-Sonet – 24%
  • Inne modele, takie jak Gemini-2.0-Flash, GPT-4o czy Nova-Pro-v1 – nawet poniżej 10%
  • Najgorzej wypadł model Qwen-2-72b, osiągając tylko 1%

Równie niepokojące okazały się rezultaty analizy przeprowadzonej przez ekspertów Salesforce, którzy testowali agenty AI w zadaniach związanych z zarządzaniem relacjami z klientami (CRM). W największą efektywnością agenty uzyskiwały do 58% w zadaniach jednoetapowych, a w złożonych, wieloetapowych działaniach nie przekraczały 35%. Dodatkowo zwrócono uwagę na brak dbania o poufność danych, co stanowi duże ryzyko dla przedsiębiorstw.

Wyzwania dotyczące bezpieczeństwa i rentowności wdrożeń

Problematyczna pozostaje kwestia bezpieczeństwa oraz prywatności. Jak podkreślają eksperci, agenty potrzebują szerokiego dostępu do danych – często o wysokim poziomie poufności – by wykonywać zadania w imieniu firmy lub użytkownika. Jeżeli nie zapewni się odpowiedniego zabezpieczenia tych informacji, masowe wdrażanie agentów w środowiskach IT będzie trudne do zrealizowania. Przewiduje się, że do końca 2027 roku ponad 40% projektów AI opartych o agentów zostanie anulowanych z powodu rosnących kosztów oraz niepewnej wartości biznesowej.

Prawdziwa i fałszywa agentowa sztuczna inteligencja

Odsetek przypadków, w których agenty AI źle wykonują powierzone zadania, nie zwiastuje szybkiego przełomu. Mimo to specjaliści są zdania, że liczba wdrożeń będzie rosła dynamicznie, a do 2028 roku około 15% codziennych decyzji w firmach będą podejmować autonomicznie właśnie agenty AI.

Zjawisko „agent washing” i sytuacja na rynku

W praktyce większość dostawców narzędzi AI określanych jako agentowe, oferuje produkty, które tak naprawdę nie spełniają definicji agentowej AI. Sprzedawane są przestarzałe narzędzia, takie jak asystenci głosowi czy programy automatyzujące procesy biurowe (RPA), prezentowane jako innowacyjne rozwiązania agentowe. Według szacunków, jedynie około 130 spośród tysięcy firm proponuje rzeczywiste agentowe rozwiązania oparte na zaawansowanym uczeniu maszynowym. Aktualnie rynek w dużej mierze wypełniony jest tzw. „fałszywą AI”.

Realne wdrożenia i obszary zastosowań

Firm przybywa, a coraz więcej globalnych graczy wdraża autentyczne rozwiązania agentowe. Przykładem mogą być wdrożenia realizowane we współpracy z Salesforce przez PepsiCo czy działania prowadzone przez koncern Bosch. Zastosowanie systemów wieloagentowych w produkcji umożliwia monitorowanie urządzeń, prognozowanie przestojów, planowanie pracy oraz wzrost efektywności. Bosch rozwija także własną platformę, która ma umożliwiać tworzenie systemów wieloagentowych przy minimalnej wiedzy programistycznej, z intencją obniżenia kosztów i zwiększenia wydajności produkcji.

  1. Mysite.ai, polski start-up, pracuje nad autonomicznym asystentem AI dla małych firm, zarządzającym obecnością online, mediami społecznościowymi, reklamą oraz generowaniem treści.

W Polsce niemal połowa pracowników wykorzystuje narzędzia generatywnej AI podczas pracy, a 74% sięga po nie minimum raz w tygodniu. Najczęściej wykorzystywane są ChatGPT, Midjourney i Microsoft Copilot. Zdaniem użytkowników narzędzia te przyczyniają się do wzrostu produktywności (71%) oraz poprawy jakości pracy (69%). Jednak skuteczność AI w dużej mierze zależy od kompetencji użytkownika, w tym umiejętności precyzyjnego określania oczekiwań i oceny uzyskanych efektów.

W skali globalnej, według danych Slack Workforce Index, codzienne wykorzystanie AI przez pracowników biurowych wzrosło na przestrzeni pół roku aż o 233%. Korzystający codziennie z AI zwiększają własną produktywność o 64% względem osób, które nie korzystają z takich technologii i wyrażają wyższy poziom zadowolenia z pracy. Narzędzia agentowe wykorzystywane są przez ok. 40% spośród tej grupy użytkowników.

Badania wśród polskich pracowników wskazują, że 70% wykazuje pozytywne lub neutralne nastawienie do współpracy z agentem AI jako partnerem służbowym. Ponad 30% ocenia potencjalną współpracę pozytywnie, a prawie 11% bardzo pozytywnie. Wskazuje to na rosnącą otwartość rynku na integrację zaawansowanej sztucznej inteligencji w codziennej pracy.

„`