هوش مصنوعی جمنای ۱٫۵ گوگل حالا می‌تواند صدای شما را بشنود

 
 

هوش مصنوعی Gemini 1.5 Pro به‌لطف آپدیت جدید گوگل می‌تواند به فایل‌های صوتی آپلودشده گوش دهد و اطلاعات را از تماس‌های دریافتی یا صدای ویدئوها بدون نیاز به دستورهای متنی استخراج کند.

در رویداد Cloud Next، گوگل اعلام کرد که مدل زبانی بزرگ جمنای ۱٫۵ پرو را برای اولین‌بار ازطریق ابزار Vertex AI دردسترس عموم ازجمله توسعه‌دهندگان قرار می‌دهد.

در‌حال‌حاضر، نسخه‌ی جدید جمنای پرو ازنظر عملکرد، از بزرگ‌ترین و قدرتمندترین مدل جمنای، یعنی اولترا ۱٫۰، پیشی گرفته است. گوگل ادعا می‌کند که جمنای ۱٫۵ پرو می‌تواند دستورالعمل‌های پیچیده را درک کند.

Gemini 1.5 Pro برای افرادی کاربردی نیست که به Vertex AI دسترسی ندارند. ناگفته نماند که جمنای اولترا به چت‌بات پیشرفته‌ی جمنای قدرت می‌دهد. این مدل زبانی بزرگ قدرتمند است و می‌تواند دستورهای متنی طولانی را درک کند؛ اما سرعت جمنای ۱٫۵ پرو را ندارد.

 
 

جمنای ۱٫۵ پرو، تنها مدل زبانی بزرگ گوگل نیست که به‌روزرسانی می‌شود. Imagen 2 ابزار تولید متن به تصویر است که به توانمندسازی قابلیت‌های تولید تصویر جمنای کمک می‌کند. این ابزار در آپدیت جدیدش به کاربران اجازه می‌دهد تا سوژه‌ها را به تصویر اضافه یا از آ‌ن‌ حذف کنند. گوگل نیز قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده با مدل‌های Imagen دردسترس قرار داده است.

 

16 1
نوشته قبلی

اطلاعات جزئی از باطری آیفون ۱۶ لو رفت

نوشته بعدی

گلکسی A55 و گلکسی A54 کدام قوی تر هستند؟

1

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

نه + 12 =

سبد خرید
ورود به حساب کاربری

یا

حساب کاربری ندارید؟

ثبت نام کنید