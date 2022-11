New Stable Diffusion 2.0 nie tylko generuje niesamowite grafiki, ale też ulepsza te niskie jakości

O powstaniu Stable Diffusion 2.0, czyli drugiej generacji narzędzia o tej samej nazwie, poinformowała firma Stability AI z siedzibą w Londynie i San Francisco. To oprogramowanie open-source do generowania obrazów, zapewnia szereg nowych funkcji oraz ulepszeń w stosunku do wersji oryginalnej. Mowa o nowych modelach tekstowo-obrazowych, które są trenowane z wykorzystaniem nowego kodera o nazwie OpenCLIP.

Samo trenowanie modelu należy do niespotykanie obciążających zadań, dlatego Stability AI musiało wykorzystać m.in. klaster ponad 4000 akceleratorów graficznych Nvidia A100 dostępnych z poziomu m.in. Amazon Web Services. W grę wchodzi bowiem karmienie sieci neuronowej ogromnymi zestawami stosownie opisanych grafik, na podstawie których Stable Diffusion 2.0 jest w stanie generować obrazy na podstawie komend tekstowych. Dokładnie tak, jak DALL-E 2 firmy Open AI.

Wspomniany koder OpenCLIP został opracowany we współpracy z firmą non-profit zajmującą się uczeniem maszynowym LAION. Jego zastosowanie znacząco poprawiło jakość generowanych przez Stable Diffusion obrazów, umożliwiając tworzenie grafik w rozdzielczości 512×512 pikseli i 768×768 pikseli. W nowej wersji model posiada też funkcję Upscaler Diffusion, która ta zwiększa rozdzielczość obrazu o współczynnik czterech, czego przykład widzicie powyżej. Obecnie scaling z rozdzielczości 128×128 do 512×512 działa niezawodnie, ale w przyszłości wartości te wzrosną do ponad 2048×2048.

Co być może najważniejsze, Stable Diffusion 2.0 doczekało się filtrów NSFW, co ma za zadanie zmniejszyć liczbę kontrowersji wokół tego open-source’owego narzędzia. Mogliście wprawdzie o nim nie słyszeć, ale prawda jest taka, że to dzieło firmy Stability AI zdobyło ogromną popularność w wersji pierwszej, a w kolejnej poprawia tak wiele w swoim działaniu, że z całą pewnością powtórzy ten sukces.