ابزار هوش مصنوعی گوگل Whisk با الهام از تصاویر میتواند تصاویری بسیار خلاقانه برای رفع نیازهای کاربران ایجاد کند.
گوگل از ابزار هوش مصنوعی جدیدی به نام Whisk رونمایی کرده است. این ابزار بهجای نیاز به دستور متنی طولانی، به کاربران اجازه میدهد با استفاده از تصاویر دیگر، تصاویر جدیدی ایجاد کنند.
با Whisk میتوانید تصاویری را برای تعیین موضوع، صحنه و سبک تصویر نهایی خود به هوش مصنوعی پیشنهاد دهید. جالب اینکه میتوانید برای هر یک از این سه بخش چندین تصویر بهعنوان الگو ارائه کنید و البته همچنان امکان واردکردن متن نیز وجود دارد.
اگر تصویری برای الگوبرداری در دسترس ندارید، با کلیک روی آیکون تاس از گوگل بخواهید الگو را برایتان انتخاب کند. در صورت تمایل میتوانید برای جزئیات بیشتر، متنی را در کادر مربوطه وارد کنید، اما این مرحله اختیاری است.
Whisk در مرحلهی بعد تصاویری را بر اساس تصاویر و متن ورودی کاربر تولید میکند و برای هر عکس متنی توصیفی نیز ارائه میدهد. در صورت رضایت از نتایج میتوانید تصویر را به لیست علاقهمندیهای خود اضافه یا آن را دانلود کنید. همچنین امکان ویرایش تصاویر با واردکردن متن بیشتر در کادر مربوطه یا کلیک روی تصویر و ویرایش متن توصیفی آن وجود دارد. بر اساس اعلام گوگل، Whisk برای «کاوش بصری سریع» طراحی شده است، نه ویرایشهای پیکسل به پیکسل.
گوگل اذعان میکند که Whisk احتمالاً در برخی موارد به هدف نرسد و به همین دلیل امکان ویرایش متنهای زیربنایی تصاویر را فراهم کرده است.
Whisk از جدیدترین نسخهی مدل هوش مصنوعی Imagen 3 استفاده میکند. گوگل همچنین Veo 2، نسخهی بعدی مدل تولیدکنندهی ویدیوی خود را معرفی کرده است که ظاهراً درک بسیار خوبی از زبان منحصربهفرد فیلمبرداری دارد و نسبت به مدلهای مشابه کمتر دچار توهماتی مانند انگشتان اضافی میشود.