چگونه با نانو بنانا پرو تصاویر دقیق با نوشتار فارسی خلق کنیم؟
گوگل دیپمایند در تاریخ ۳۰ آبان ۱۴۰۴ از مدل پیشرفتهی خود با نام نانو بانانا پرو (Nano Banana Pro) رونمایی کرد. ویژگی برجستهی این مدل جدید، رندرینگ متن بهبودیافته (Improved text rendering) و دانش جهانی ارتقایافته (Enhanced world knowledge) محسوب میشود که محدودیتهای پیشین در نمایش متون پیچیده را از میان برمیدارد.
اکنون به لطف این مدل جدید، کاربران میتوانند متون فارسی را در سناریوهای مختلف مانند دیوارنویسیهای شهری یا بیلبوردهای تبلیغاتی، با دقتی خیرهکننده و بدون درهمریختگی حروف بازسازی کنند.
در این مقاله، با مجموعهای از پرامپتهای کاربردی، قدرت آن را در خلق تصاویر واقعگرایانه و تایپوگرافی فارسی به چالش میکشیم.
چطور از نانو بنانا پرو برای ایجاد تصاویر استفاده کنیم؟
نانو بانانا پرو هماکنون از طریق نسخهی وب یا اپلیکیشن جمنای و با انتخاب گزینهی Thinking در دسترس کاربران قرار دارد. همچنین توسعهدهندگان میتوانند از طریق AI Studio (با پرداخت هزینه) به آن دسترسی داشته باشند.
گوگل برای مدیریت منابع پردازشی سنگین این مدل، سیاستهای خاصی را اعمال کرده است:
- کاربران رایگان: در هر بازهی زمانی، تنها امکان تولید ۳ تا ۴ تصویر با مدل پرو را دارند و پس از آن باید چند ساعت صبر کنند تا سهمیهی آنها شارژ شود. پس از اتمام سهمیه، سیستم به مدل قدیمیتر (نانو بانانا معمولی) سوئیچ میکند.
- کاربران اشتراک پرو (Google AI Pro): این کاربران سهمیهی بیشتری برای تولید تصویر باکیفیت بالا دارند، اما آنها نیز پس از تولید تعداد مشخصی تصویر، با محدودیت مواجه شده و به مدل استاندارد بازگردانده میشوند.
قدرتنمایی نانو بانانا پرو در سناریوهای واقعی
پرامپتهایی که در ادامه مشاهده میکنید، نمونههایی برای نمایش قدرت مدل نانو بانانا پرو در درک زبان، بافت و نورپردازی هستند. این دستورات نشان میدهند که چگونه نانو بانانا پرو با تکیه بر دانش جهانی ارتقایافته، جزئیات محیطی را تشخیص میدهد و متن فارسی را بهعنوان بخشی طبیعی از تصویر رندر میکند.
برای خلق تصاویر این مقاله از پرامپتهای انگلیسی ذکرشده استفاده شد؛ اما شما میتوانید با استفاده از پرامپتهای فارسی نیز نتایج خوبی بگیرید.
۱. دیوارنویسی در حیاط مدرسه
این نمونه نشان میدهد که مدل چگونه متنی فارسی را روی دیوار سیمانی یک مدرسهی پسرانه با بافتی قدیمی و پوستهپوسته حک میکند:
۲. بیلبورد بزرگراهی
این دستور قدرت مدل را در خلق یک بیلبورد تبلیغاتی باکیفیت در فضای بزرگراههای تهران و با تمرکز بر کنتراست بالا به نمایش میگذارد:
۳. یادداشت دستنویس روی میز کار
این مثال توانایی مدل در شبیهسازی فشار خودکار و دستخط فارسی روی کاغذ را در یک محیط اداری مدرن نشان میدهد:
۴. طراحی قوطی نوشیدنی
این دستور دقت مدل در خلق «طرحهای باکیفیت استودیویی» و قرار دادن متن فارسی بهصورت عمودی روی سطوح منحنی را ثابت میکند:
۵. اینفوگرافیک و بصریسازی دادهها
این بخش پتانسیل مدل برای تولید محتوای آموزشی و ترسیم ساختارهای پیچیده را آشکار میسازد. در ادامه دو سناریوی مختلف برای ساخت اینفوگرافیک را مشاهده میکنید:
سناریوی الف: ساختار وب (دادهنمایی انتزاعی) این پرامپت یک اینفوگرافیک وکتور با ساختار لایهبندیشده و برچسبهای فارسی دقیق تولید میکند:
سناریوی ب: راهنمای تصویری (آموزش قدمبهقدم) این مثال قدرت مدل در تولید محتوای آموزشی چندمرحلهای برای فرایندی مانند دمکردن قهوه را نشان میدهد:
۶. تابلو خوشنویسی
این پرامپت مهارت مدل در ترکیب خط نستعلیق با دکوراسیون داخلی و مدیریت بازتاب نور روی شیشه را به تصویر میکشد:
۷. فرم ثبتنام باشگاه
این مثال نشان میدهد که چگونه میتوان اسناد متنی باکیفیت را اسکن و فرمبندی دقیق فارسی را با هوش مصنوعی تولید کرد:
پیشرفتهای نانو بانانا پرو، آیندهای را نوید میدهد که در آن مرز میان طراحی گرافیک سنتی و تولید تصویر با هوش مصنوعی کمرنگتر از همیشه خواهد شد. توانایی درک زمینههای فرهنگی و زبانی، این مدل را به ابزاری قدرتمند برای تولید محتوای بومی تبدیل کرده است.
چه ایدههایی برای بهکارگیری قدرت نانو بانانا پرو در روند کاری روزمرهی خود دارید؟ دیدگاه خود را با ما در میان بگذارید.