10 دقیقه
NanoBanana، هوش مصنوعی تولید تصویر مبتنی بر تکنولوژی Gemini، حالا فراتر از اپلیکیشن Gemini حرکت کرده و مستقیماً درون Google Search و Google Lens قرار گرفته است. کاربران اکنون میتوانند بدون نیاز به نصب برنامهای جداگانه، از طریق نوار جستجو و تجربه دوربین Lens تصاویر را ایجاد و ویرایش کنند.
نحوه نمایش NanoBanana در حالت AI Mode جستجوی گوگل
درون حالت AI Mode در Google Search، یک آیکون جدید بعلاوه (+) در پایین-چپ فیلد متن ظاهر میشود، در حالی که جستجوی صوتی و Lens به سمت راست منتقل شدهاند. این تغییر ظریف دسترسی سریع به ابزارهای ساخت و ویرایش تصویر را بدون خروج از صفحه نتایج، ممکن میسازد.
- منوی جدید به گالری شما، دوربین و یک گزینه Create پیوند میدهد که با ایموجی موز مشخص شده است.
- انتخاب Create جایگزین متن راهنما را به «تصویر خود را توصیف کنید» میکند تا بتوانید دستور متنی تایپ کنید یا عکس بارگذاری کنید برای ویرایش.
- تصاویر تولیدشده مانند نمونههای اپ Gemini رفتار میکنند: قابل دانلود، قابل اشتراکگذاری و با واترمارک برند Gemini در گوشه.
این پیادهسازی در ترکیب با رابط کاربری AI Mode بهگونهای طراحی شده که جریان کار تولید تصویر را کوتاه و مستقیم نگه دارد. دسترسی یکمرحلهای از کادر جستجو به ابزار ویرایش و تولید، مخصوصاً برای کاربرانی که به دنبال سرعت و کارایی هستند مفید است. علاوه بر این، یکپارچهسازی در سطح نتایج جستجو میتواند روند ایدهپردازی بصری را روانتر کند: گرفتن ایده از صفحه نتایج و بلافاصله تبدیل آن به تصویر یا اصلاح عکس موجود.
چرا این تغییر مهم است
ترکیب NanoBanana با Google Search به معنی قرار گرفتن ابزار پیشرفته تولید تصویر در نقطهای است که کاربران بیشتر زمان خود را صرف جستجو و کاوش میکنند. این همگرایی تجربه جستجو، جستجوی بصری و تولید محتوای مولد (generative content) را به هم پیوند میدهد و مسیری کوتاهتر از ایده تا خروجی نهایی فراهم میآورد. برای کسبوکارها، سازندگان محتوا و توسعهدهندگان تجربه کاربری، این اقدام امکانات جدیدی برای تست سریع مفاهیم بصری، تولید محتوای تبلیغاتی و نمونهسازی بصری میسازد.
![]() | ![]() | ![]() |
ایجاد و ویرایش لحظهای در Google Lens
Google Lens یک تب Create تازه دریافت کرده است که NanoBanana بهصورت بومی در آن ادغام شده است. بازطراحی جدید، برچسبهای متنی را زیر آیکونها قرار میدهد تا فیلترهای بیشتری همزمان نمایش داده شوند و دکمه شاتر اکنون با ایموجی موز نمایش داده میشود—دوستداشتنی، مستقیم و قابل تشخیص.
بهصورت پیشفرض، فیلتر از دوربین سلفی استفاده میکند (شما میتوانید دوربین را از سمت راست تغییر دهید). بعد از ثبت تصویر، تصویر به باکس ورودی AI Mode منتقل میشود تا بتوانید یک پرامپت متنی اضافه کنید و به NanoBanana دستور تولید یا ویرایش تصویر را بدهید.
چرخه کار در Lens چگونه است
چرخه کار استاندارد در Lens با NanoBanana معمولاً شامل مراحل زیر است: انتخاب تب Create، گرفتن یا بارگذاری یک عکس، تنظیم دوربین یا فیلترهای مرتبط، وارد کردن دستور متنی (prompt) و در نهایت مشاهده خروجی و اعمال تصحیحات بیشتر. این چرخه کوتاه شده به کاربران امکان میدهد سریعتر به نتایج بصری برسند و بدون خروج از تجربه دوربین، نسخههای متعددی از یک تصویر تولید یا ویرایش کنند.
برای مثال، یک طراح مد میتواند در حین بازدید از فروشگاه با یک عکس ساده از یک پارچه، چندین نسخه استایلدهی شده را فوراً تولید کند و ایدههای رنگبندی یا الگو را آزمایش کند. این نوع جریان کاری، بهرهوری و نوآوری تصویری را در محیطهای میدانی افزایش میدهد.
زیر کاپوت: Gemini 2.5 Flash Image
مدل تصویری که NanoBanana را درون گوگل تغذیه میکند، Gemini 2.5 Flash Image است؛ مدلی که هم ویرایش تصویر و هم تولید تصویر را مستقیماً داخل Search و Lens پشتیبانی میکند. خروجیها شامل گزینههای دانلود و اشتراکگذاری بوده و واترمارک Gemini را حفظ میکنند که به شناسایی محتوای تولیدشده توسط هوش مصنوعی کمک میکند.
Gemini 2.5 Flash Image بهعنوان یک نمونه پیشرفته از مدلهای چندرسانهای، برای پردازش سریع و پاسخدهی مناسب برای محیطهای موبایل بهینه شده است. این مدل توانایی درک دستورهای متنی همراه با ورودیهای بصری را دارد و میتواند تغییرات محلی، بازخلق سبکها و تولید محتوای جدید را با جزئیات معنیدار انجام دهد.
ویژگیهای فنی و محدودیتها
در سطح فنی، Gemini 2.5 Flash Image ترکیبی از معماریهای یادگیری عمیق تصویری و مولد است که برای تاخیر کم و مصرف منطقی منابع طراحی شده. با این حال، مدل همچنان با چالشهایی مثل امکان حذف یا جابجایی جزئیات ظریف در پردازشهای پیچیده، مدیریت ناصحیح نورپردازی در برخی خروجیها و نگرانیهای مربوط به تعصب دادهها مواجه است. همینطور واترمارک و برچسبگذاری خروجیها به منظور شفافیت و رعایت سیاستهای شناسایی محتوای تولیدشده توسط هوش مصنوعی در نظر گرفته شده است.
قابلیت ویرایش محلی (local edits) و بازتولید سبک (style transfer) از ویژگیهای برجسته این مدل هستند که برای کارهای خلاقانه، تبلیغاتی و نمونهسازی سریع قابل استفادهاند. اما برای پروژههای دقیق صنعتی یا چاپهای با کیفیت بالا، بررسی انسانی و پردازش تکمیلی همچنان توصیه میشود.
![]() | ![]() | ![]() |
چه کسانی اکنون میتوانند از آن استفاده کنند؟
این قابلیت از امروز برای کاربران اندروید در ایالات متحده که در برنامه Search Lab ثبتنام کرده و حالت AI Mode را فعال کردهاند، در حال عرضه است. اگر جزو آن گروه آزمایشی هستید، انتظار داشته باشید گزینههای NanoBanana بهزودی در هر دو محیط Search و Lens برای شما ظاهر شود.
برای کاربران خارج از ایالات متحده یا کسانی که هنوز به برنامه آزمایشی دسترسی ندارند، عرضه تدریجی و گسترش جغرافیایی محتمل است؛ تجربههای قبلی گوگل نشان میدهد که ویژگیهای جدید ابتدا در بازارهای محدود آزمایش میشوند و سپس به مرور در دسترس کاربران بیشتری قرار میگیرند. همچنین، توجه داشته باشید که در دسترس بودن برخی قابلیتها ممکن است بسته به نسخه سیستمعامل، مدل دستگاه و تنظیمات حریم خصوصی متفاوت باشد.
نمونههای کاربردی و سناریوهای واقعی
تصور کنید عکسی بگیرید، یک پرامپت کوتاه تایپ کنید و تصویر ویرایششده یا جدید را بدون جابجایی بین اپها دریافت کنید — NanoBanana تلاش میکند که این روند را بیدرز کند. نمونههای کاربردی عبارتند از:
- تولید سریع تصاویر تبلیغاتی برای شبکههای اجتماعی بدون ترک صفحه جستجو
- ویرایش لحظهای عکسهای میدانی برای روزنامهنگاران و بلاگرها
- نمونهسازی ایدههای طراحی داخلی یا مد در محیط فروشگاه یا نمایشگاه
- تحلیل بصری و افزودن لایههای اطلاعاتی به عکسها برای آموزش یا ارائه محتوا
این یکپارچهسازی تولید تصویر مولد را به قلب ابزارهای جستجو و دوربین گوگل میآورد و مسیر جدیدی برای خلق محتوا، بهینهسازی روند کاری تولیدکنندگان محتوا و تسهیل دسترسی کاربران عادی به فناوریهای مولد فراهم میکند.
ملاحظات مربوط به حریم خصوصی و شناسایی محتوا
یکی از جنبههای مهم انتشار این نوع فناوریها، مسائل مربوط به حریم خصوصی و شفافیت است. حضور واترمارک Gemini روی تصاویر تولیدشده یک لایه شناسایی اضافه میکند که به کاربران و ناظران کمک میکند محتوای مولد را تشخیص دهند. در عین حال، اطلاعاتی مانند متادیتا، مجوزهای دسترسی به گالری یا دوربین و سیاستهای ذخیرهسازی داده باید بهوضوح توسط گوگل اعلام شوند تا اطمینان حاصل شود کاربران کنترل لازم را بر محتوای خود حفظ میکنند.
گوگل معمولاً در مستندات و سیاستهای خود اطلاعاتی درباره نحوه ذخیرهسازی و پردازش دادهها ارائه میکند؛ با این حال، هنگام استفاده از قابلیتهای تولید تصویر و ارسال تصاویر به سرویسهای ابری، کاربران و سازمانها باید سیاستهای داخلی خود را نیز بررسی کنند تا با نیازهای حفظ حریم خصوصی و امنیت دادهها تطابق داشته باشند.
تحلیل رقابتی و ارزش افزوده NanoBanana
در فضای رقابتی فعلی که شرکتهای فناوری متعددی روی تولید تصویر هوش مصنوعی کار میکنند، ادغام یک مدل مولد تصویر در محیطهای جستجو و لنز میتواند مزیت رقابتی محسوب شود. دسترسی بدون درز به تولید تصویر در لحظه، به همراه امکانات اشتراکگذاری و دانلود و برچسبگذاری خروجیها، برای بسیاری از کاربران ارزش عملی قابل توجهی ایجاد میکند.
مزیتهای کلیدی شامل کاهش زمان از ایده تا خروجی، امکانات تست و نمونهسازی سریع و همگرایی با ابزارهای موجود گوگل مانند جستجو و لنز است. این همگرایی میتواند مسیرهای جدیدی برای تبلیغات تصویری، ابزارهای خلاقانه تعاملی و تجربههای ترکیبی (hybrid experiences) بین جستجو و محتوا فراهم آورد.
چالشها و موارد قابل توجه برای کسبوکارها
اگرچه امکانات جذاب است، کسبوکارها باید محدودیتهای مدلهای مولد، نیاز به بررسیهای انسانی برای خروجیهای حساس و مسائل حقوق مالکیت معنوی را در نظر بگیرند. استفاده از تصاویر تولیدشده در کمپینهای تجاری ممکن استنیازمند شفافیت در مورد منشأ تصویر و رعایت قوانین مرتبط با استفاده از تصویر افراد یا آثار دارای حق نشر باشد.
بهعلاوه، شرکتها باید سیاستهای داخلی در مورد استفاده از AI در تولید محتوا را تعریف کنند تا ریسکهای قانونی، اخلاقی و بازاریابی مدیریت شوند. در مواردی که دقت بصری یا استاندارد کیفیت بالا مورد نیاز است، ترکیب خروجیهای مولد با ویرایش انسانی حرفهای بهترین رویکرد خواهد بود.
جمعبندی و چشمانداز
ادغام NanoBanana با Google Search و Google Lens یک گام مهم در آوردن قابلیتهای تولید تصویر مولد به جریانهای کاری روزمره کاربران است. این قابلیت، تجربههای خلاقانه و تولید محتوا را تسریع میبخشد و امکانات جدیدی برای سازندگان، بازاریابان و کاربران عادی فراهم میآورد. در عین حال، توجه به ملاحظات فنی، حقوقی و حریم خصوصی برای پذیرش گسترده و مسئولانه این فناوری حیاتی خواهد بود.
با ادامه پیشرفت مدلهای تصویری مانند Gemini 2.5 Flash Image و گسترش دسترسی جغرافیایی و پلتفرمی، انتظار میرود ویژگیهای بیشتر و امکانات تخصصیتری در آینده نزدیک به این ابزارها افزوده شود. برای کاربرانی که به دنبال آزمایش تولید تصویر در لحظه هستند، این ادغام نقطه شروع مناسبی است تا توانمندیهای مولد تصویر را در محیطهای جستجو و دوربین تجربه کنند.
اگر میخواهید فوراً شروع کنید و جزو گروه آزمایشی نیستید، دنبال اعلامیههای رسمی گوگل باشید یا ثبتنام در برنامههای آزمایشی مانند Search Lab میتواند مسیر دسترسی به این امکانات را تسریع کند. در نهایت، NanoBanana نشان میدهد که تولید تصویر هوش مصنوعی در حال تبدیل شدن به یک ابزار پایه در تجربههای روزمره دیجیتال است.
منبع: smarti






ارسال نظر