Nowy raport przez The Information ujawnia wiele wewnętrznych zawirowań stojących za odświeżoną wersją Siri w ramach Apple Intelligence

Najnowsze doniesienia rzucają ponure światło na kulisy rozwoju Siri, wirtualnego asystenta Apple, który od lat pozostaje w tyle za konkurencją. Wspomniany raport maluje obraz wewnętrznego chaosu, ciągłych zmian strategii i frustracji inżynierów, co ma być główną przyczyną niepowodzeń w ulepszaniu tej kluczowej funkcji. Jak wspomniałam, gigant z Cupertino obiecywał w zeszłym roku, że Siri zyska kontekst osobisty, śledząc informacje z całego systemu, w tym maile, zdjęcia, pliki czy wiadomości i będzie mogła wchodzić z nimi w interakcję, by lepiej odpowiadać na nasze pytania i oferować bardziej spersonalizowane sugestie. Pojawi się również „świadomość” tego, co dzieje się na ekranie oraz integracja z aplikacjami Apple’a i firm trzecich.

Czytaj też: Inteligentniejsza Siri jest naprawdę potrzebna. Na razie asystent Apple’a nie wie nawet, jaki mamy miesiąc

Oczywiście te zmiany wciąż nie byłyby w stanie sprawić, że Siri dogoni konkurencję w postaci Gemini, jednak byłby to krok w dobrą stronę. Niestety jak na razie iOS 18.4 został już udostępniony, a ulepszonej Siri jak nie było, tak nie ma nadal. Klienci się niecierpliwią, a ich irytacja narasta i temu zupełnie się nie dziwię, ponieważ Apple obiecał sporo, a dał bardzo niewiele. Tymczasem nowa Siri sprawia problemy i to nie tylko w zakresie samego rozwoju, bo jeśli wierzyć plotkom, u źródła tych problemów zdaje się leżeć brak spójnej wizji i ciągłe modyfikacje planów dotyczących architektury Apple Intelligence, w ramach której Siri ma zostać zmodernizowana.

Czytaj też: Po miesiącach oczekiwania stabilna wersja One UI 7 trafia do Polski. Które modele dostaną aktualizację?

Początkowo rozważano budowę dwóch rodzajów modeli językowych – mniejszego do zadań lokalnych i większego, działającego w chmurze, o czym zresztą nie raz słyszeliśmy w różnych raportach. Ostatecznie jednak zdecydowano się na pojedynczy, chmurowy model, co było tylko jednym z wielu zwrotów akcji, które miały zniechęcić zespół inżynierski i doprowadzić do odejść kluczowych pracowników. Oprócz problemów technicznych, raport ujawnia głęboko zakorzenione konflikty personalne i brak jasnego przywództwa w dziale AI/ML Apple. Byli pracownicy opisują kulturę pracy jako “zbyt swobodną” oraz brak ambicji i chęci do podejmowania ryzyka w kontekście rozwoju Siri.

Siri stoi pod dużym znakiem zapytania, co podkreśla fakt, że podobno wewnętrznie grupa ta zyskała ironiczny przydomek “AIMLess” (bezcelowa), a sama Siri jest traktowana jak “gorący ziemniak”, nieustannie przekazywany między różnymi zespołami bez widocznych postępów. Przy okazji pojawiały się też tarcia związane z kwestiami płacowymi i benefitami dla pracowników działu AI. Nie brzmi to dobrze, prawda? A na tym jeszcze nie koniec.

Obecnie widzimy, że Google czy Open AI śmiało eksperymentują ze swoimi chatbotami. Gemini dostaje coraz więcej funkcji, zarówno tych ogólnych, z których korzystamy również na komputerze, jak i „skrojonych” na potrzeby Androida, gdzie służy nam jako prawdziwy wirtualny asystent. ChatGPT też nie zostaje w tyle. Problem w tym, że Apple zdaje się nie traktować tego zbyt poważnie. Szef działu AI, John Giannandrea, bagatelizował znaczenie chatbotów takich jak ChatGPT, twierdząc, że nie wnoszą one wiele wartości dla użytkowników. W 2023 roku menedżerowie zabronili też inżynierom wykorzystywania modeli językowych innych firm w finalnych produktach Apple, zezwalając jedynie na ich użycie do benchmarkowania własnych, które, jak się okazało, znacząco ustępowały technologii OpenAI.

Czytaj też: Potężna aktualizacja Gemini. Raporty lepsze niż kiedykolwiek

Doszliśmy więc do sytuacji, w której konkurencja opracowuje kolejne przełomowe rozwiązania, a Apple przez dwa lata usuwał słowo “hey” z komendy “hey Siri”. Jak wspomina The Information, lider zespołu Siri, Robby Walker, skupiał się na “małych zwycięstwach”, takich jak skrócenie czasu reakcji asystenta, a nawet zablokował również inicjatywę zespołu inżynierów, którzy chcieli wykorzystać duże modele językowe, aby nadać Siri większą inteligencję emocjonalną. Fiaskiem zakończył się również projekt “Link”, którego celem było stworzenie poleceń głosowych do sterowania aplikacjami na platformie Vision Pro. Większość planowanych funkcji, takich jak nawigacja po sieci i zmiana rozmiaru okien za pomocą głosu, została porzucona z powodu niezdolności zespołu Siri do ich realizacji.

Czytaj też: Generator obrazów w ChatGPT dostępny dla wszystkich. OpenAI rusza na wojnę z Google

Zeszłoroczna konferencja WWDC 2024 i prezentacja Apple Intelligence wydaje się być kulminacją tego chaosu. Imponująca demonstracja, na której pokazano integrację Siri z e-mailami i wiadomościami w celu dostarczania kontekstowych informacji, było w rzeczywistości fikcyjnych i zaskoczyło nawet sam zespół Siri. Innymi słowy klienci zostali skuszeni niedziałającymi funkcjami, co mocno kłóci się z dotychczasowym podejściem giganta. Mimo wszystko może nie wszystko jest jeszcze stracone, bo los Siri może się jeszcze odwrócić. Tylko czy nie jest na to za późno? Spójrzmy prawdzie w oczy, asystent Apple’a obecnie znajduje się na żenującym poziomie w porównaniu do konkurencji i nawet jeśli zespół giganta weźmie się do pracy, minie dużo czasu, zanim uda mu się osiągnąć poziom dzisiejszego Gemini czy ChatGPT, a przecież Google i OpenAI nie będą czekać na to bezczynnie.