انقلاب در تولید تصویر با هوش مصنوعی

کد خبر : 12036

10:18

1404/12/08

سونیوز: گوگل از نسل جدید هوش مصنوعی تولید تصویر با نام «Nano Banana 2» رونمایی کرد. قابلیت‌های خیره‌کننده از جمله دقت ۴K و حفظ هویت سوژه‌ها در این مدل جدید.

به گزارش سونیوز، شرکت گوگل رسماً از جدیدترین نسخه ابزار تولید تصویر مبتنی بر هوش مصنوعی خود با نام «Nano Banana 2» رونمایی کرد. مدلی که بر اساس معماری قدرتمند Gemini 3.1 Flash Image ساخته شده و وعده می‌دهد تصاویر را سریع‌تر، دقیق‌تر و با کیفیتی فراتر از قبل تولید کند.

«Nano Banana 2» که با نام رسمی Gemini 3.1 Flash Image شناخته می‌شود، جدیدترین عضو خانواده موفق «نانو بندانا» است. این خانواده که از آگوست ۲۰۲۵ با مدل اولیه Nano Banana Imageآغاز به کار کرد، در نوامبر همان سال با نسخه حرفه‌ای Nano Banana Pro (Gemini 3 Pro Image) به اوج محبوبیت رسید و حالا نسل جدید با ترکیب سرعت فلش و کیفیت پرو عرضه شده است.

تحول در تولید تصویر با سرعت نور
یکی از وعده‌های اصلی گوگل برای Nano Banana 2، ثبت عنوان «سریع‌ترین نسخه تا به امروز» است. این مدل تولید و ویرایش تصویر را با تأخیر بسیار کم و در کوتاه‌ترین زمان ممکن انجام می‌دهد. ناینا رایسینگانی، مدیر محصول گوگل دیپ‌مایند، تأکید کرده که این سرعت بالا به کاربران اجازه می‌دهد تا ایده‌های خود را بدون وقفه و با چندین بار تکرار سریع، به واقعیت تبدیل کنند.

ویژگی‌های انقلابی نسخه جدید
Nano Banana 2 با بهره‌گیری از دانش جهانی پیشرفته مدل جمینی، تحولی اساسی در تولید تصاویر هوش مصنوعی ایجاد کرده است . مهمترین قابلیت‌های این مدل عبارتند از:

حفظ سازگاری سوژه‌ها (Subject Consistency): این مدل می‌تواند شباهت ظاهری تا ۵ شخصیت و وفاداری بصری تا ۱۴ شیء را در یک فرآیند تولید تصویر حفظ کند. این ویژگی برای داستان‌سرایی تصویری، ساخت استوری‌بورد و تولید کمیک‌استریپ‌های حرفه‌ای انقلابی محسوب می‌شود.

پشتیبانی از رزولوشن تا ۴K: تصاویر تولید شده با این مدل شفاف‌تر، با جزئیات بیشتر و نورپردازی زنده‌تر هستند. کاربران می‌توانند از رزولوشن ۵۱۲ پیکسل برای سرعت بالا تا ۴K برای خروجی‌های آماده چاپ و تولید محتوای حرفه‌ای استفاده کنند.

بازنمایی دقیق متن و ترجمه درون‌تصویری: یکی از چالش‌های همیشگی ابزارهای تولید تصویر، مدیریت دقیق متن درون تصویر بود. Nano Banana 2 این مشکل را به شکل چشمگیری حل کرده است. این مدل نه‌تنها متن را با دقت بالا در تصویر قرار می‌دهد، بلکه قابلیت بومی‌سازی و ترجمه متن به زبان‌های مختلف را مستقیماً درون تصویر فراهم کرده است.

پیروی دقیق از دستورالعمل‌های پیچیده: مدل جدید گوگل در درک و اجرای درخواست‌های چندلایه و پیچیده کاربران دقت بسیار بالایی دارد و تصویر نهایی را دقیقاً مطابق با ایده اصلی خلق می‌کند.

دسترسی همگانی؛ از کاربران عادی تا حرفه‌ای
نکته قابل توجه در مورد Nano Banana 2 این است که بسیاری از قابلیت‌هایی که پیش‌تر فقط در نسخه حرفه‌ای (Pro) و برای مشترکان پولی در دسترس بود، اکنون در نسخه اصلی و حتی برای کاربران رایگان نیز قابل دسترس خواهد بود . این مدل از امروز در اپلیکیشن Gemini در دسترس قرار گرفته و جایگزین Nano Banana Pro شده است. مشترکان Google AI Pro و Ultra همچنان می‌توانند برای وظایف تخصصی از نسخه Pro استفاده کنند.

Nano Banana 2 به تدریج در سایر سرویس‌های گوگل از جمله «حالت هوش مصنوعی» (AI Mode) در جستجوی گوگل، Google Lens، ابزار ویدئویی Flow، پلتفرم توسعه‌دهندگان Google AI Studio و حتی Vertex AI برای مشتریان سازمانی فعال خواهد شد.

نگاه سونیوز به امنیت و اصالت محتوا
با گسترش تولید محتوای مصنوعی، گوگل هم‌زمان با معرفی Nano Banana 2، بر تعهد خود به شفافیت تأکید کرده است. تصاویر تولید شده با این مدل با فناوری SynthID و استاندارد C2PA نشانه‌گذاری می‌شوند تا کاربران بتوانند اصالت محتوا و چگونگی تولید آن را تشخیص دهند.

رقابت تنگاتنگ در عرصه تصویرسازی هوشمند
ابزارهای تولید تصویر هوش مصنوعی در سال‌های اخیر با سرعت چشمگیری در حال تکامل هستند. طبق تازه‌ترین رتبه‌بندی Artificial Analysis، مدل GPT Image 1.5 شرکت OpenAI با امتیاز ۱۲۴۵ در صدر قرار دارد و پس از آن Nano Banana Pro گوگل با امتیاز ۱۲۱۶ در جایگاه دوم ایستاده است . به اعتقاد کارشناسان ZDNET، Nano Banana Pro با کسب امتیاز ۹۳ درصدی در آزمون‌های عملی، به عنوان «برترین ابزار تولید تصویر هوش مصنوعی» شناخته شده است.

گوگل با عرضه Nano Banana 2 تلاش می‌کند تا با ترکیب سرعت فلش و کیفیت پرو، فاصله خود با رقبا را کاهش داده و حتی از آن‌ها پیشی بگیرد. تحلیلگران معتقدند این مدل جدید می‌تواند تأثیر عمیقی بر نحوه تولید تصاویر توسط کاربران عادی، طراحان، بازاریابان و تولیدکنندگان محتوا در سراسر جهان بگذارد.