ویرایش تصاویر فقط با کشیدن خط به کمک Gemini Nano Banana

1404/10/8
عکس
120
0
0

گوگل به‌تازگی یک به‌روزرسانی مهم برای اپلیکیشن Gemini منتشر کرده است که روش جدید و بسیار ساده‌تری برای ویرایش تصاویر ارائه می‌دهد. در این قابلیت تازه که با فناوری Nano Banana کار می‌کند، کاربران می‌توانند مستقیماً روی عکس‌ها نقاشی کنند، علامت بزنند یا بخش خاصی را مشخص کنند تا هوش مصنوعی همان قسمت را ویرایش کند.

هدف گوگل از این به‌روزرسانی، طبیعی‌تر شدن تعامل با هوش مصنوعی، افزایش دقت بصری و ساده‌سازی استفاده برای کاربران مبتدی است؛ به‌طوری که دیگر لازم نباشد برای هر تغییر، توضیحات طولانی و پیچیده تایپ شود.

قابلیت جدید ویرایش تصویر با کشیدن و علامت‌گذاری (AI Drawing Edit)

گوگل با این آپدیت، توانایی‌های اپلیکیشن Gemini را با دو تغییر مهم گسترش داده است. اولین تغییر مربوط به ویرایش تصویر به‌صورت بصری است؛ قابلیتی که نیاز به نوشتن دستورات متنی طولانی را تا حد زیادی از بین می‌برد.

چگونه کار می‌کند؟

کاربر ابتدا تصویر موردنظر را داخل بخش درخواست (Prompt Box) اضافه می‌کند
سپس وارد یک محیط جدید به نام Mark Up Editor می‌شود
در این محیط می‌تواند:
- روی عکس نقاشی کند
- بخش خاصی را هایلایت کند
- با فلش یا خط به قسمت مشخصی اشاره کند
- یا ناحیه‌ای را که می‌خواهد تغییر کند دقیقاً نشان دهد

به زبان ساده، به‌جای اینکه بگویید «لطفاً پس‌زمینه سمت چپ تصویر را تار کن»، فقط کافی است همان قسمت را روی عکس علامت بزنید.

نوشتن دستور روی خود تصویر

علاوه بر ابزار نقاشی، کاربران می‌توانند با استفاده از ابزار متن، دستور یا توضیح موردنظرشان را مستقیماً روی خود عکس بنویسند.
البته امکان استفاده از دستورات متنی معمولی همچنان وجود دارد و کاربران می‌توانند هر دو روش را با هم ترکیب کنند.

گوگل در توضیح این قابلیت گفته است:

«این روش باعث می‌شود درخواست‌های مبتنی بر تصویر بسیار شهودی‌تر شوند، به‌خصوص زمانی که کاربر می‌خواهد فقط یک بخش خاص از عکس را تغییر دهد یا بررسی کند، بدون اینکه مجبور باشد آن را با کلمات توضیح دهد.»

زمان عرضه و پلتفرم‌ها

این قابلیت جدید به‌صورت تدریجی در حال عرضه است و روی پلتفرم‌های زیر در دسترس قرار می‌گیرد:

اندروید
iOS
نسخه وب

وقتی کاربران برای اولین بار تصویری را آپلود می‌کنند، یک راهنمای کوتاه برای آشنایی با این قابلیت جدید به آن‌ها نمایش داده می‌شود تا استفاده از آن ساده‌تر باشد.

سیستم تشخیص محتوای تولیدشده با هوش مصنوعی (Google SynthID)

با پیشرفت هوش مصنوعی، تشخیص ویدیوهای واقعی از ویدیوهای تولیدشده با AI روزبه‌روز سخت‌تر می‌شود. برای مقابله با این مشکل، گوگل ابزارهای تشخیص محتوای هوش مصنوعی در Gemini را قوی‌تر کرده است.

گوگل اکنون قابلیت SynthID Verification را که قبلاً فقط برای تصاویر بود، به ویدیوها نیز گسترش داده است.

ویژگی‌های این سیستم:

کاربران می‌توانند ویدیوهایی تا ۱۰۰ مگابایت حجم و ۹۰ ثانیه طول آپلود کنند
Gemini مشخص می‌کند که آیا ویدیو:
- توسط هوش مصنوعی گوگل ساخته شده
- یا با آن ویرایش شده است

این سیستم می‌تواند:

وجود واترمارک SynthID را در تصویر و صدا تشخیص دهد
جزئیات دقیقی از الگوی ویرایش هوش مصنوعی ارائه کند
حتی مشخص کند در کدام دقیقه یا بخش صوتی از ویدیو، ردپای هوش مصنوعی وجود دارد

نکته مهم این است که Gemini تأکید می‌کند:

تصویر و صدا در فرآیند بررسی تغییری داده نمی‌شوند و فقط تحلیل انجام می‌شود.

این موضوع به افزایش شفافیت و اعتماد در استفاده‌های حرفه‌ای، رسانه‌ای و تجاری کمک زیادی می‌کند.

دسترسی جهانی

قابلیت بررسی تصویر و ویدیو از نظر تولید یا ویرایش با هوش مصنوعی، در تمام زبان‌ها و مناطقی که Gemini پشتیبانی می‌شود در دسترس قرار دارد.

جمع‌بندی نهایی

با این به‌روزرسانی، هدف گوگل برای تبدیل Gemini به یک ابزار کاربردی، قابل اعتماد و خلاقانه بیش از هر زمان دیگری مشخص شده است. گوگل تلاش می‌کند تعامل با هوش مصنوعی:

طبیعی‌تر باشد
کمتر به دستورات دقیق و پیچیده متنی وابسته باشد
و برای کاربران عادی هم قابل استفاده شود

در شرایطی که نگرانی‌ها درباره محتوای تولیدشده با هوش مصنوعی رو به افزایش است، ترکیب ویرایش بصری و سیستم تشخیص داخلی محتوا می‌تواند نقش مهمی در افزایش اعتماد کاربران به هوش مصنوعی مولد ایفا کند.