تولید تصاویر باور نکردنی از انسان توسط هوش مصنوعی Stable Diffusion

شرکت Stability AI، که نامش در فضای پرجمعیت هوش مصنوعی مولد به تدریج کمرنگ میشود، یک شرکت پیشرو در زمینه هوش مصنوعی است که به توسعه مدلهای پیشرفته و متنباز هوش مصنوعی پرداخته و هوش مصنوعی Stable Diffusion را برای تولید تصاویر هوش مصنوعی ساخته است.
این شرکت Stable Diffusion 3 Medium (SD3M) را عرضه کرد که یکی از معروفترین مدل های آن محسوب می شود. هوش مصنوعی Stable Diffusion 3 “پیشرفتهترین مدل تولید تصویر ما تا به امروز” نامید شده است. با این حال، کاربران دنیای واقعی بیشتر ترس را تجربه میکنند تا پیچیدگی، زیرا مدل متن به تصویر به طور مداوم تصاویر عجیب و باورنکردنی خلق میکند. برای دیدن ویژگی های عجیب این هوش مصنوعی ادامه مطلب را در پرشین وی ببینید.
هوش مصنوعی Stable Diffusion
Stable Diffusion یکی از معروفترین مدلهای تولید تصویر Stability AI است. این مدل از تکنیکهای پیشرفته برای تبدیل توصیفهای متنی به تصاویر استفاده میکند. نسخههای مختلف این مدل، از جمله Stable Diffusion 3، توانایی خلق تصاویر بسیار پیچیده و خلاقانه را دارند.
هوش مصنوعی Stable Diffusion 3 یک نقطه عطف مهم در تکامل هوش مصنوعی مولد است و شرکت تعهد داده است که دموکراتیزه کردن این فناوری قدرتمند را ادامه میدهد.
اندازه کوچک این مدل آن را برای اجرا روی کامپیوترها و لپتاپهای مصرفکننده و همچنین GPUهای سطح سازمانی مناسب میسازد. این مدل به اندازهای مناسب است که میتواند به استاندارد بعدی در مدلهای تبدیل متن به تصویر تبدیل شود.
شرکت Stability AI به طرفداران خود وعده داده که این مدل “تصاویری با جزئیات استثنایی، رنگ و نورپردازی عالی ایجاد میکند و خروجیهای فوتورئالیستی و همچنین خروجیهای با کیفیت بالا در سبکهای متنوع را فراهم میکند.” و عملکرد خود را نسبت به “مشکلات رایج سایر مدلها، مانند واقعگرایی در دستها و چهرهها…” بهبود داده است. بااینحال این هوش مصنوعی در برخی موارد تصاویر عجیبی از دست، چهره و آناتومی آدمها تولید کرده که بسیار عجیب است.
تصاویر عجیب هوش مصنوعی Stable Diffusion 3
برخی کاربران که با این هوش مصنوعی تصویر تولید کرده و منتشر کردهاند، برخلاف وعده Stability AI، دست، بدن و چهره انسانها حالتی درهم و غیرواقعی دارند.
کاربری میگوید فقط توانسته از پرامپتهای آماده این مدل تصاویر خوبی تولید کند، پرامپتهای توصیفی زیادی را امتحان کرده و موفق نشده حتی یک پرامپت کاملاً ساده مانند ‘عکس یک نفر که در یک اتاق نشیمن چرت میزند’ را تولید کند و تصویری شبیه به هیولاهای فیلمهای کروننبرگ تولید کرده است .
در تصویر دیگری، دختری را میبینیم که گرچه چهره و موهایش بسیار واقعی است، دو دست و انگشتهای او حالت طبیعی ندارند. البته عموماً مدلهای هوش مصنوعی مولد انگشتها را درست ترسیم نمیکنند ولی اخیراً برخی مدلها بهبودهای قابلتوجهی در این زمینه داشتهاند.
ضعف هوش مصنوعی جدید Stability AI به دست کارکترها محدود نیست. این هوش مصنوعی در برخی تصاویر حتی در تشخیص صحیح آناتومی بدن نیز مشکل دارد. در تصویر پایین میبینیم که بهرغم جزئیات خیرهکننده موی کارکتر و چمن، هوش مصنوعی نتوانسته است اعضای بدن را درست تولید کند.
باتوجهبه متنباز بودن مدلهای Stable Diffusion 3 میتوان امیدوار بود که توسعهدهندگان مختلف آخرین مدل این هوش مصنوعی را بهبود بدهند.
برای امتحان مدلهای Stable Diffusion 3، میتوانید از API در پلتفرم Stability استفاده کنید، برای آزمایش رایگان سهروزه در Stable Assistant ثبتنام کنید، و Stable Artisan را از طریق Discord امتحان کنید.
چه چیزی SD3 Medium را متمایز میکند؟
SD3 Medium یک مدل SD3 با ۲ میلیارد پارامتر است که ویژگیهای قابل توجهی را ارائه میدهد:
کیفیت کلی و فوتورئالیسم: تصاویر با جزئیات استثنایی، رنگ و نورپردازی عالی ایجاد میکند که خروجیهای فوتورئالیستی و همچنین خروجیهای با کیفیت بالا در سبکهای متنوع را ممکن میسازد. موفقیت در رفع مشکلات رایج سایر مدلها، مانند واقعگرایی در دستها و چهرهها، از طریق نوآوریهایی مانند VAE ۱۶ کاناله به دست آمده است.
درک پرامپت: پرامپتهای طولانی و پیچیده را که شامل استدلال فضایی، عناصر ترکیبی، اقدامات و سبکها هستند، درک میکند. با استفاده از هر سه انکودر متنی یا ترکیبی از آنها، کاربران میتوانند عملکرد را در مقابل کارایی معامله کنند.
تایپوگرافی: با استفاده از معماری Diffusion Transformer ما، کیفیت متن بیسابقهای را با خطاهای کمتر در املا، فاصله حروف، تشکیل حروف و فاصلهگذاری به دست میآورد.
منابع کارآمد: به لطف استفاده کم از VRAM، برای اجرا بر روی GPUهای مصرفی استاندارد بدون کاهش عملکرد ایدهآل است.
تنظیم دقیق: توانایی جذب جزئیات ظریف از مجموعه دادههای کوچک، که آن را برای شخصیسازی مناسب میسازد.
کاربردهای Stability AI
هنر دیجیتال: ایجاد آثار هنری دیجیتال با استفاده از مدلهای تولید تصویر.
بازیسازی: خلق شخصیتها و محیطهای بازی با استفاده از هوش مصنوعی.
تبلیغات و بازاریابی: تولید محتوای بصری جذاب برای کمپینهای تبلیغاتی.
پژوهش و آموزش: استفاده در تحقیقات هوش مصنوعی و آموزش مدلهای جدید.
Stability AI با تلاش برای توسعه مدلهای هوش مصنوعی پیشرفته و متنباز، نقش مهمی در پیشرفت فناوری و کاربردهای مختلف آن دارد. این شرکت با تمرکز بر کیفیت، دقت، و اخلاق در هوش مصنوعی، به یکی از شرکتهای تاثیرگذار در این حوزه تبدیل شده است.
ویژگیهای کلیدی Stability AI
مدلهای متنباز: Stability AI مدلهای هوش مصنوعی خود را به صورت متنباز ارائه میدهد تا جامعه علمی و توسعهدهندگان بتوانند به راحتی از آنها استفاده کرده و بهبود دهند. این رویکرد به اشتراکگذاری دانش و پیشرفت سریعتر در زمینه هوش مصنوعی کمک میکند.
کیفیت و دقت بالا: مدلهای Stability AI به خاطر دقت بالا و توانایی تولید محتوای با کیفیت شناخته شدهاند. مدلهای تولید تصویر این شرکت میتوانند تصاویری واقعگرایانه و خلاقانه از توصیفهای متنی تولید کنند.
کاربرد گسترده: مدلهای Stability AI در زمینههای مختلفی از جمله هنر دیجیتال، بازیسازی، طراحی، تبلیغات و پژوهش قابل استفاده هستند. این تنوع کاربرد به کاربران امکان میدهد تا از این فناوری در پروژههای مختلف بهره ببرند.
تمرکز بر اخلاق و ایمنی: Stability AI توجه ویژهای به مسائل اخلاقی و ایمنی در استفاده از هوش مصنوعی دارد. این شرکت سعی میکند مدلهای خود را به گونهای توسعه دهد که امکان سوءاستفاده از آنها به حداقل برسد و استفاده ایمن و مسئولانه از آنها تشویق شود.