Microsoft Copilot Vision może teraz skanować w czasie rzeczywistym cały pulpit Windows

Microsoft rozszerza możliwości Copilot Vision o funkcję „Desktop Share”, która pozwala asystentowi AI analizować cały pulpit Windows w czasie rzeczywistym. To znaczący krok naprzód w integracji sztucznej inteligencji z systemem operacyjnym.
Windows 11
Windows 11

Copilot Vision otrzymuje jedną z najważniejszych aktualizacji od momentu swojego debiutu. Nowa funkcja „Desktop Share” umożliwia asystentowi AI firmy Microsoft “widzenie” i analizowanie całego pulpitu użytkownika, a nie tylko pojedynczych okien aplikacji, jak to było dotychczas.

Jak działa nowa funkcja?

Uruchomienie funkcji jest bardzo proste. Wystarczy kliknąć ikonę okularów w aplikacji Copilot i wybrać, którym oknem lub całym pulpitem chcemy się podzielić. AI może wtedy w czasie rzeczywistym analizować wszystko, co jest wyświetlane na ekranie, i udzielać kontekstowych porad oraz odpowiedzi na pytania użytkownika.

Copilot Vision może „widzieć to, co widzisz, i rozmawiać z tobą o tym w czasie rzeczywistym”, jak opisuje to Microsoft na swoim blogu. Asystent może analizować treści, dostarczać wskazówki i odpowiadać na pytania dotyczące wszystkiego, co widzi na ekranie – od edycji CV, przez burze mózgów nad projektami kreatywnymi, po nawigację w nieznanym oprogramowaniu czy nawet granie w gry.

Pełna kontrola użytkownika nad prywatnością

Microsoft zdaje sobie sprawę z kontrowersji związanych z wcześniejszą funkcją Recall i dlatego postawił na całkowicie odmienne podejście. Desktop Share z Copilot Vision jest opcjonalne, wymagając od użytkowników przyznania dostępu, zanim Copilot będzie mógł zobaczyć ich ekran.

Użytkownik ma pełną kontrolę nad tym, kiedy funkcja jest aktywna. Można ją zatrzymać w każdej chwili, klikając przycisk “Stop” lub “X” w interfejsie Copilot. Microsoft podkreślił, że Copilot Vision nie działa skrycie. System nie będzie automatycznie skanował ani przetwarzał zawartości ekranu, chyba że użytkownik aktywnie rozpocznie udostępnianie.

Dostępność i wymagania

Aktualizacja jest obecnie dostępna dla uczestników programu Windows Insiders w Stanach Zjednoczonych, którzy mają Windows 10 lub Windows 11 oraz Copilot w wersji 1.25071.125 lub wyższej. Microsoft planuje stopniowe rozszerzanie dostępu na inne kraje, jednak obecnie funkcja jest ograniczona do rynków, gdzie Windows Vision została już włączona.

Funkcja jest udostępniana za pośrednictwem Microsoft Store, co pozwala na kontrolowane wdrożenie i zbieranie opinii użytkowników przed pełnym globalnym uruchomieniem.

Różnica względem funkcji Recall

Warto podkreślić kluczową różnicę między nową funkcją a kontrowersyjną funkcją Recall. W przeciwieństwie do Microsoft Recall, która wykonuje zrzuty ekranu w tle, Copilot Vision wymaga aktywnego włączenia przez użytkownika i działa tylko podczas jawnie rozpoczętych sesji udostępniania.

Różnice w podejściu do multimodalności

O ile Google Gemini koncentruje się na przetwarzaniu tekstu i rozbudowanych odpowiedziach, a Apple Intelligence na prywatności i funkcjach fotograficznych, Microsoft stawia na praktyczną integrację z codzienną pracą przy komputerze. Copilot Vision może analizować kod, dokumenty, strony internetowe czy gry – wszystko w czasie rzeczywistym.

Apple Intelligence oferuje podobne możliwości wizualne przez Visual Intelligence z Camera Control, które pozwala identyfikować obiekty, tłumaczyć tekst czy uzyskiwać informacje o miejscach. Jednak jest to ograniczone do iPhone’ów 16. generacji i wymaga skierowania kamery na obiekt. Dodatkowo Apple Intelligence wymaga zmiany języka systemu na angielski, co stanowi znaczącą niedogodność dla polskich użytkowników.

Znaczenie dla polskiego rynku

Dla polskich użytkowników istotne jest to, że Copilot Vision może działać z polskimi treściami wyświetlanymi na ekranie, choć interfejs asystenta pozostaje w języku angielskim. W przeciwieństwie do tego, Apple Intelligence – choć jest już technicznie dostępne w Polsce – wymaga zmiany całego języka systemu na angielski, co stanowi znaczną niedogodność.

Przyszłość AI w Windows

Ta aktualizacja jest częścią szerszej strategii Microsoft mającej na celu głębszą integrację sztucznej inteligencji z Windows. Copilot może teraz poruszać się po wielu aplikacjach jednocześnie i służyć jako przewodnik, gdy tego potrzebujesz, oferując użytkownikom możliwość udostępniania dwóch aplikacji jednocześnie.

Dzięki nowej funkcji Highlights, Copilot może dodatkowo pokazywać użytkownikom „jak” wykonać konkretne zadanie, wskazując w aplikacji, gdzie kliknąć i co zrobić. To odpowiedź na rosnące oczekiwania użytkowników, którzy – jak pokazuje praktyka – coraz częściej używają AI do konkretnych zadań biznesowych i kreatywnych.

Czytaj też: Windows 11 będzie opisywać obrazy za pomocą AI. Wszystko odbędzie się lokalnie

Microsoft planuje dalszy rozwój Copilot Vision, sugerując, że to dopiero początek rewolucji w sposobie interakcji z komputerami. Jeśli funkcja okaże się popularna wśród użytkowników, możemy spodziewać się jej szybkiego rozwoju i dostępności na szerszą skalę.