VideoCAD – baza wiedzy z ponad 41 tysięcy przykładów pracy projektantów
Co odróżnia ten projekt od innych narzędzi AI? Przede wszystkim sposób nauki – system nie generuje gotowych obrazów, tylko faktycznie korzysta z oprogramowania CAD – klika w przyciski, nawiguje po menu i wykonuje konkretne operacje. Nauczył się tego wszystkiego, analizując tysiące godzin pracy ludzkich specjalistów – podstawą całego przedsięwzięcia jest VideoCAD, niezwykły zbiór danych zawierający zapis ponad 41 tysięcy sesji projektowych. Każdy materiał wideo dokumentuje kompletny proces tworzenia, od pierwszego szkicu po finalny model 3D. System rejestruje absolutnie wszystko: ruchy kursora, kolejność wybieranych narzędzi, sekwencje kliknięć i całą resztę aktywności w interfejsie.

Najciekawsze jednak dzieje się w warstwie przetwarzania tych informacji. Zespół z MIT opracował metodę tłumaczenia wysokopoziomowych poleceń projektowych na konkretne akcje w programie. Gdy człowiek wydaje komendę „narysuj linię”, AI rozumie to jako serię precyzyjnych operacji: przesunięcie kursora do określonych współrzędnych, aktywacja odpowiedniego narzędzia i wykonanie koniecznych kliknięć.
Takie podejście okazało się kluczowe dla powodzenia całego projektu. Wcześniejsze próby uczenia maszyn projektowania 3D skupiały się na abstrakcyjnych komendach, które nie przekładały się na praktyczne umiejętności obsługi oprogramowania. Tutaj AI uczy się dokładnie tego samego, co początkujący użytkownik – gdzie klikać, jakie narzędzia wybierać i jak poruszać się po interfejsie.
Czytaj też: Amazon Prime Video zapowiada wielki powrót serii Stargate
Samodzielna praca AI w CAD – od koncepcji do realizacji bez pomocy człowieka
Po zakończeniu etapu uczenia system zaprezentował imponujące możliwości. Otrzymując prosty szkic 2D, potrafi samodzielnie uruchomić oprogramowanie, dobrać właściwe narzędzia i zbudować kompletny model 3D. Testy przeprowadzono na różnych poziomach trudności – od podstawowych kształtów geometrycznych po skomplikowane układy architektoniczne. Badacze widzą w tym rozwiązaniu fundament pod coś, co nazywają „drugim pilotem CAD”. Chodzi o asystenta, który nie tylko wykonuje polecenia, ale też sugeruje kolejne kroki, automatyzuje powtarzalne zadania i w trakcie pracy uczy użytkownika najlepszych praktyk.
Dla osób zaczynających przygodę z projektowaniem 3D taki pomocnik mógłby być nieoceniony – wejście w świat profesjonalnego CAD zawsze bowiem wiązało się z wysoką barierą – skomplikowane oprogramowanie, długa nauka i kosztowne kursy. System MIT może to zmienić, pozwalając użytkownikom skupić się na kreatywnej stronie projektowania, podczas gdy AI zajmie się techniczną realizacją pomysłów.
Potencjał tego rozwiązania wykracza oczywiście poza pomoc początkującym. Doświadczeni inżynierowie mogliby wykorzystać system do automatyzacji rutynowych zadań, które pochłaniają godziny pracy, ale nie wymagają twórczego myślenia. Modyfikacje standardowych elementów, przygotowywanie wariantów projektów czy tworzenie dokumentacji technicznej – wszystko to mogłoby zostać znacząco przyspieszone.
Zespół z MIT podkreśla, że to dopiero początek rozwoju tej technologii. Obecnie system jest szkolony na coraz bardziej złożonych projektach, a plany obejmują rozszerzenie wsparcia na różne platformy CAD i zaawansowane workflow. Największym wyzwaniem pozostaje skalowanie – nauczenie AI wszystkich funkcji profesjonalnego oprogramowania wymaga ogromnych zbiorów danych i mocy obliczeniowej.
VideoCAD pokazuje, jak zacierają się granice między ludzkimi i maszynowymi umiejętnościami. Nie chodzi tu o zastąpienie projektantów przez sztuczną inteligencję, ale o dostarczenie im narzędzi, które pozwolą skupić się na tym, co najważniejsze – kreatywności i rozwiązywaniu problemów. Techniczna strona realizacji pomysłów może zostać zautomatyzowana, otwierając świat zaawansowanego projektowania 3D dla znacznie szerszego grona odbiorców.
Moralne zwycięstwo spinacza biurowego (czyli asystenta)
Patrząc na projekt z pewnym dystansem, widać zarówno jego potencjał, jak i obecne ograniczenia. System rzeczywiście imponuje umiejętnością naśladowania ludzkich działań, ale wciąż wymaga ogromnych ilości danych treningowych. Każda nowa funkcja czy zmiana w interfejsie oznacza konieczność ponownego uczenia.
Warto też zauważyć, że choć AI radzi sobie z odtwarzaniem poznanych schematów, nie wiadomo jeszcze, jak poradzi sobie z naprawdę innowacyjnymi rozwiązaniami projektowymi. Siłą ludzkich projektantów jest umiejętność wyjścia poza utarte ścieżki i wymyślenie czegoś zupełnie nowego – jak na razie żadne stworzone przez nas AI nie jest do tego zdolne.
Mimo tych zastrzeżeń projekt VideoCAD udowadnia, że można nauczyć AI posługiwania się istniejącymi programami w sposób naturalny dla człowieka. To podejście może w przyszłości ułatwić integrację sztucznej inteligencji z codzienną pracą projektantów, bez konieczności rewolucji w stosowanych narzędziach.