اپل امروز چند مدل زبانی بزرگ (LLM) متنباز منتشر کرد که برای اجرا بهصورت محلی روی دستگاه طراحی شدهاند و به سرورهای ابری وابسته نیستند. این LLM-ها که OpenELM (مدلهای زبانی کارآمد متنباز) نامیده میشوند، در Hugging Face Hub، انجمنی برای اشتراکگذاری کدهای هوش مصنوعی، دردسترس هستند.
طبق گفتهی اپل، در مجموع هشت OpenELM وجود دارد که چهار مدل از آنها با استفاده از کتابخانهی CoreNet از قبل آموزش داده شدهاند و چهار مدل دیگر با دستورالعملها آموزش دیدهاند. اپل از یک استراتژی مقیاسبندی لایهای استفاده کرده که هدف آن بهبود دقت و کارایی است.
اپل بهجای مدلهای آموزشدیدهی نهایی، کدها، گزارشهای آموزشی و نسخههای متعدد را ارائه کرده است. محققان امیدوارند که این پروژه منجر به پیشرفت سریعتر و «نتایج قابلاعتمادتر» در زمینهی هوش مصنوعی شود.
اپل میگوید هوش مصنوعی جدیدش شامل چارچوب کاملی برای آموزش و ارزیابی مدلهای زبانی بزرگ در دیتاستهای دردسترس عموم است؛ از جمله گزارشهای آموزشی و مواردی از این دست.
اپل میگوید که OpenELM را برای «توانمندسازی و غنیسازی جامعهی تحقیقاتی متنباز» با مدلهای زبانی پیشرفته منتشر میکند. به اشتراکگذاری مدلهای متنباز به محققان راهی برای بررسی خطرات و دادهها و سوگیریهای مدل میدهد. توسعهدهندگان و شرکتها میتوانند از مدلهای پیشفرض به همان شکل استفاده یا تغییراتی در آنها ایجاد کنند.
اشتراکگذاری آزاد اطلاعات به ابزار مهمی برای جذب مهندسان، دانشمندان و کارشناسان برتر تبدیل شده است؛ چراکه فرصتهایی برای مقالات تحقیقاتی فراهم میکند که بهطور معمول تحت سیاستهای محرمانهی اپل نمیتوانستند منتشر شوند.