سه شنبه, ۳۰ بهمن , ۱۴۰۳
درخواست تبلیغات

تولید تصاویر باور نکردنی از انسان توسط هوش مصنوعی Stable Diffusion

کامپیوتر و موبایل
هوش مصنوعی Stable Diffusion یکی از معروف‌ترین مدل‌های تولید تصویر Stability AI است که از تکنیک‌های پیشرفته برای تبدیل توصیف‌های متنی به تصاویر استفاده می‌کند. نسخه‌های مختلف این مدل، از جمله Stable Diffusion 3، توانایی خلق تصاویر بسیار پیچیده و خلاقانه از انسان را دارند.

شرکت Stability AI، که نامش در فضای پرجمعیت هوش مصنوعی مولد به تدریج کم‌رنگ می‌شود، یک شرکت پیشرو در زمینه هوش مصنوعی است که به توسعه مدل‌های پیشرفته و متن‌باز هوش مصنوعی پرداخته و هوش مصنوعی Stable Diffusion را برای تولید تصاویر هوش مصنوعی ساخته است.

این شرکت Stable Diffusion 3 Medium (SD3M) را عرضه کرد که یکی از معروف‌ترین مدل های آن محسوب می شود. هوش مصنوعی Stable Diffusion 3 “پیشرفته‌ترین مدل تولید تصویر ما تا به امروز” نامید شده است. با این حال، کاربران دنیای واقعی بیشتر ترس را تجربه می‌کنند تا پیچیدگی، زیرا مدل متن به تصویر به طور مداوم تصاویر عجیب و باورنکردنی خلق می‌کند. برای دیدن ویژگی های عجیب این هوش مصنوعی ادامه مطلب را در پرشین وی ببینید.

هوش مصنوعی Stable Diffusion

Stable Diffusion یکی از معروف‌ترین مدل‌های تولید تصویر Stability AI است. این مدل از تکنیک‌های پیشرفته برای تبدیل توصیف‌های متنی به تصاویر استفاده می‌کند. نسخه‌های مختلف این مدل، از جمله Stable Diffusion 3، توانایی خلق تصاویر بسیار پیچیده و خلاقانه را دارند.

هوش مصنوعی Stable Diffusion 3 یک نقطه عطف مهم در تکامل هوش مصنوعی مولد است و شرکت تعهد داده است که دموکراتیزه کردن این فناوری قدرتمند را ادامه می‌دهد.

اندازه کوچک این مدل آن را برای اجرا روی کامپیوترها و لپ‌تاپ‌های مصرف‌کننده و همچنین GPUهای سطح سازمانی مناسب می‌سازد. این مدل به اندازه‌ای مناسب است که می‌تواند به استاندارد بعدی در مدل‌های تبدیل متن به تصویر تبدیل شود.

شرکت Stability AI به طرفداران خود وعده داده که این مدل “تصاویری با جزئیات استثنایی، رنگ و نورپردازی عالی ایجاد می‌کند و خروجی‌های فوتورئالیستی و همچنین خروجی‌های با کیفیت بالا در سبک‌های متنوع را فراهم می‌کند.” و عملکرد خود را نسبت به “مشکلات رایج سایر مدل‌ها، مانند واقع‌گرایی در دست‌ها و چهره‌ها…” بهبود داده است. بااین‌حال این هوش مصنوعی در برخی موارد تصاویر عجیبی از دست، چهره و آناتومی آدم‌ها تولید کرده که بسیار عجیب است.

هوش مصنوعی Stable Diffusion

تصاویر عجیب هوش مصنوعی Stable Diffusion 3

برخی کاربران که با این هوش مصنوعی تصویر تولید کرده و منتشر کرده‌اند، برخلاف وعده Stability AI، دست، بدن و چهره انسان‌ها حالتی درهم و غیرواقعی دارند.

کاربری می‌گوید فقط توانسته از پرامپت‌های آماده این مدل تصاویر خوبی تولید کند، پرامپت‌های توصیفی زیادی را امتحان کرده و موفق نشده حتی یک پرامپت کاملاً ساده مانند ‘عکس یک نفر که در یک اتاق نشیمن چرت می‌زند’ را تولید کند و تصویری شبیه به هیولاهای فیلم‌های کروننبرگ تولید کرده است .

هوش مصنوعی Stable Diffusion

در تصویر دیگری، دختری را می‌بینیم که گرچه چهره و موهایش بسیار واقعی است، دو دست و انگشت‌های او حالت طبیعی ندارند. البته عموماً مدل‌های هوش مصنوعی مولد انگشت‌ها را درست ترسیم نمی‌کنند ولی اخیراً برخی مدل‌ها بهبودهای قابل‌توجهی در این زمینه داشته‌اند.

هوش مصنوعی جدید Stability

ضعف هوش مصنوعی جدید Stability AI به دست کارکترها محدود نیست. این هوش مصنوعی در برخی تصاویر حتی در تشخیص صحیح آناتومی بدن نیز مشکل دارد. در تصویر پایین می‌بینیم که به‌رغم جزئیات خیره‌کننده موی کارکتر و چمن‌، هوش مصنوعی نتوانسته است اعضای بدن را درست تولید کند.

تولید تصاویر بدن

باتوجه‌به متن‌باز بودن مدل‌های  Stable Diffusion 3 می‌توان امیدوار بود که توسعه‌دهندگان مختلف آخرین مدل این هوش مصنوعی را بهبود بدهند.

برای امتحان مدل‌های Stable Diffusion 3، می‌توانید از API در پلتفرم Stability استفاده کنید، برای آزمایش رایگان سه‌روزه در Stable Assistant ثبت‌نام کنید، و Stable Artisan را از طریق Discord امتحان کنید.

چه چیزی SD3 Medium را متمایز می‌کند؟

SD3 Medium یک مدل SD3 با ۲ میلیارد پارامتر است که ویژگی‌های قابل توجهی را ارائه می‌دهد:

کیفیت کلی و فوتورئالیسم: تصاویر با جزئیات استثنایی، رنگ و نورپردازی عالی ایجاد می‌کند که خروجی‌های فوتورئالیستی و همچنین خروجی‌های با کیفیت بالا در سبک‌های متنوع را ممکن می‌سازد. موفقیت در رفع مشکلات رایج سایر مدل‌ها، مانند واقع‌گرایی در دست‌ها و چهره‌ها، از طریق نوآوری‌هایی مانند VAE ۱۶ کاناله به دست آمده است.

درک پرامپت: پرامپت‌های طولانی و پیچیده را که شامل استدلال فضایی، عناصر ترکیبی، اقدامات و سبک‌ها هستند، درک می‌کند. با استفاده از هر سه انکودر متنی یا ترکیبی از آن‌ها، کاربران می‌توانند عملکرد را در مقابل کارایی معامله کنند.

تایپوگرافی: با استفاده از معماری Diffusion Transformer ما، کیفیت متن بی‌سابقه‌ای را با خطاهای کمتر در املا، فاصله حروف، تشکیل حروف و فاصله‌گذاری به دست می‌آورد.

منابع کارآمد: به لطف استفاده کم از VRAM، برای اجرا بر روی GPUهای مصرفی استاندارد بدون کاهش عملکرد ایده‌آل است.

تنظیم دقیق: توانایی جذب جزئیات ظریف از مجموعه داده‌های کوچک، که آن را برای شخصی‌سازی مناسب می‌سازد.

کاربردهای Stability AI

هنر دیجیتال: ایجاد آثار هنری دیجیتال با استفاده از مدل‌های تولید تصویر.

بازی‌سازی: خلق شخصیت‌ها و محیط‌های بازی با استفاده از هوش مصنوعی.

تبلیغات و بازاریابی: تولید محتوای بصری جذاب برای کمپین‌های تبلیغاتی.

پژوهش و آموزش: استفاده در تحقیقات هوش مصنوعی و آموزش مدل‌های جدید.

Stability AI با تلاش برای توسعه مدل‌های هوش مصنوعی پیشرفته و متن‌باز، نقش مهمی در پیشرفت فناوری و کاربردهای مختلف آن دارد. این شرکت با تمرکز بر کیفیت، دقت، و اخلاق در هوش مصنوعی، به یکی از شرکت‌های تاثیرگذار در این حوزه تبدیل شده است.

ویژگی‌های کلیدی Stability AI

مدل‌های متن‌باز: Stability AI مدل‌های هوش مصنوعی خود را به صورت متن‌باز ارائه می‌دهد تا جامعه علمی و توسعه‌دهندگان بتوانند به راحتی از آن‌ها استفاده کرده و بهبود دهند. این رویکرد به اشتراک‌گذاری دانش و پیشرفت سریع‌تر در زمینه هوش مصنوعی کمک می‌کند.

کیفیت و دقت بالا: مدل‌های Stability AI به خاطر دقت بالا و توانایی تولید محتوای با کیفیت شناخته شده‌اند. مدل‌های تولید تصویر این شرکت می‌توانند تصاویری واقع‌گرایانه و خلاقانه از توصیف‌های متنی تولید کنند.

کاربرد گسترده: مدل‌های Stability AI در زمینه‌های مختلفی از جمله هنر دیجیتال، بازی‌سازی، طراحی، تبلیغات و پژوهش قابل استفاده هستند. این تنوع کاربرد به کاربران امکان می‌دهد تا از این فناوری در پروژه‌های مختلف بهره ببرند.

تمرکز بر اخلاق و ایمنی: Stability AI توجه ویژه‌ای به مسائل اخلاقی و ایمنی در استفاده از هوش مصنوعی دارد. این شرکت سعی می‌کند مدل‌های خود را به گونه‌ای توسعه دهد که امکان سوءاستفاده از آن‌ها به حداقل برسد و استفاده ایمن و مسئولانه از آن‌ها تشویق شود.

گردآوری:

اخبار مرتبط: