گوگل بهتازگی یک بهروزرسانی مهم برای اپلیکیشن Gemini منتشر کرده است که روش جدید و بسیار سادهتری برای ویرایش تصاویر ارائه میدهد. در این قابلیت تازه که با فناوری Nano Banana کار میکند، کاربران میتوانند مستقیماً روی عکسها نقاشی کنند، علامت بزنند یا بخش خاصی را مشخص کنند تا هوش مصنوعی همان قسمت را ویرایش کند.
هدف گوگل از این بهروزرسانی، طبیعیتر شدن تعامل با هوش مصنوعی، افزایش دقت بصری و سادهسازی استفاده برای کاربران مبتدی است؛ بهطوری که دیگر لازم نباشد برای هر تغییر، توضیحات طولانی و پیچیده تایپ شود.
قابلیت جدید ویرایش تصویر با کشیدن و علامتگذاری (AI Drawing Edit)
گوگل با این آپدیت، تواناییهای اپلیکیشن Gemini را با دو تغییر مهم گسترش داده است. اولین تغییر مربوط به ویرایش تصویر بهصورت بصری است؛ قابلیتی که نیاز به نوشتن دستورات متنی طولانی را تا حد زیادی از بین میبرد.
چگونه کار میکند؟
به زبان ساده، بهجای اینکه بگویید «لطفاً پسزمینه سمت چپ تصویر را تار کن»، فقط کافی است همان قسمت را روی عکس علامت بزنید.
نوشتن دستور روی خود تصویر
علاوه بر ابزار نقاشی، کاربران میتوانند با استفاده از ابزار متن، دستور یا توضیح موردنظرشان را مستقیماً روی خود عکس بنویسند.
البته امکان استفاده از دستورات متنی معمولی همچنان وجود دارد و کاربران میتوانند هر دو روش را با هم ترکیب کنند.
گوگل در توضیح این قابلیت گفته است:
«این روش باعث میشود درخواستهای مبتنی بر تصویر بسیار شهودیتر شوند، بهخصوص زمانی که کاربر میخواهد فقط یک بخش خاص از عکس را تغییر دهد یا بررسی کند، بدون اینکه مجبور باشد آن را با کلمات توضیح دهد.»
زمان عرضه و پلتفرمها
این قابلیت جدید بهصورت تدریجی در حال عرضه است و روی پلتفرمهای زیر در دسترس قرار میگیرد:
وقتی کاربران برای اولین بار تصویری را آپلود میکنند، یک راهنمای کوتاه برای آشنایی با این قابلیت جدید به آنها نمایش داده میشود تا استفاده از آن سادهتر باشد.
سیستم تشخیص محتوای تولیدشده با هوش مصنوعی (Google SynthID)
با پیشرفت هوش مصنوعی، تشخیص ویدیوهای واقعی از ویدیوهای تولیدشده با AI روزبهروز سختتر میشود. برای مقابله با این مشکل، گوگل ابزارهای تشخیص محتوای هوش مصنوعی در Gemini را قویتر کرده است.
گوگل اکنون قابلیت SynthID Verification را که قبلاً فقط برای تصاویر بود، به ویدیوها نیز گسترش داده است.
ویژگیهای این سیستم:
این سیستم میتواند:
-
وجود واترمارک SynthID را در تصویر و صدا تشخیص دهد
-
جزئیات دقیقی از الگوی ویرایش هوش مصنوعی ارائه کند
-
حتی مشخص کند در کدام دقیقه یا بخش صوتی از ویدیو، ردپای هوش مصنوعی وجود دارد
نکته مهم این است که Gemini تأکید میکند:
تصویر و صدا در فرآیند بررسی تغییری داده نمیشوند و فقط تحلیل انجام میشود.
این موضوع به افزایش شفافیت و اعتماد در استفادههای حرفهای، رسانهای و تجاری کمک زیادی میکند.
دسترسی جهانی
قابلیت بررسی تصویر و ویدیو از نظر تولید یا ویرایش با هوش مصنوعی، در تمام زبانها و مناطقی که Gemini پشتیبانی میشود در دسترس قرار دارد.
جمعبندی نهایی
با این بهروزرسانی، هدف گوگل برای تبدیل Gemini به یک ابزار کاربردی، قابل اعتماد و خلاقانه بیش از هر زمان دیگری مشخص شده است. گوگل تلاش میکند تعامل با هوش مصنوعی:
در شرایطی که نگرانیها درباره محتوای تولیدشده با هوش مصنوعی رو به افزایش است، ترکیب ویرایش بصری و سیستم تشخیص داخلی محتوا میتواند نقش مهمی در افزایش اعتماد کاربران به هوش مصنوعی مولد ایفا کند.