اپل مدل هوش مصنوعی متن باز خود را منتشر کرد که روی دستگاه اجرا می‌شوند

اپل مدل هوش مصنوعی متن باز خود را منتشر کرد که روی دستگاه اجرا می‌شوند

اپل امروز چندین مدل زبان بزرگ متن باز (LLM) منتشر کرد که به جای سرورهای ابری، روی دستگاه اجرا می شوند. این مدل هوش مصنوعی ها که OpenELM (مدل های زبان کارآمد متن باز) نامیده می شوند، در Hugging Face Hub، یک انجمن برای به اشتراک گذاری کد هوش مصنوعی، در دسترس هستند.

همانطور که در یک PDF توضیح داده شده است، در مجموع هشت مدل هوش مصنوعی OpenELM وجود دارد که چهار مورد از آنها با استفاده از کتابخانه CoreNet و چهار مدل دیگر با تنظیم دستورالعمل پیش آموزش داده شده اند. اپل از یک استراتژی مقیاس گذاری لایه ای استفاده می کند که به منظور بهبود دقت و کارایی طراحی شده است.

اپل به جای اینکه فقط مدل هوش مصنوعی نهایی آموزش دیده را ارائه دهد، کد و گزارش های آموزشی و چندین نسخه را در اختیار عموم قرار داده است و محققان پشت این پروژه امیدوارند که این امر به پیشرفت سریعتر و “نتایج قابل اعتمادتر” در زمینه هوش مصنوعی زبان طبیعی منجر شود.

مدل هوش مصنوعی OpenELM، یک مدل زبان باز در سطح بالا است. OpenELM از یک استراتژی مقیاس گذاری لایه ای برای تخصیص کارآمد پارامترها در هر لایه از مدل ترانسفورماتور استفاده می کند که منجر به دقت بالاتر می شود. برای مثال، OpenELM با بودجه پارامتری تقریباً یک میلیارد پارامتر، در مقایسه با OLMo، 2.36 درصد بهبود دقت را نشان می دهد، در حالی که به 2 برابر توکن کمتر برای پیش آموزش نیاز دارد.

برخلاف رویه های قبلی که فقط وزن مدل و کد استنتاج را ارائه می دهند و روی مجموعه داده های خصوصی پیش آموزش می دهند، این مدل شامل چارچوب کامل برای آموزش و ارزیابی مدل زبان روی مجموعه داده های در دسترس عموم، از جمله گزارش های آموزشی، چندین نقطه کنترل و پیکربندی های پیش آموزش است.

اپل می گوید که مدل های هوش مصنوعی OpenELM را برای “توانمندسازی و غنی سازی جامعه تحقیقاتی باز” با مدل های زبان پیشرفته منتشر می کند. به اشتراک گذاشتن مدل های متن باز به محققان راهی برای بررسی خطرات و سوگیری های داده و مدل می دهد. توسعه دهندگان و شرکت ها می توانند از مدل های هوش مصنوعی استفاده کنند یا اصلاحاتی را انجام دهند.

اشتراک گذاری باز اطلاعات به ابزاری مهم برای اپل برای جذب مهندسان، دانشمندان و متخصصان برتر تبدیل شده است زیرا فرصتی را برای مقالات تحقیقاتی فراهم می کند که به طور معمول با سیاست های مخفیانه اپل هماهنگ نمی‌باشد.

اپل هنوز این نوع قابلیت های هوش مصنوعی را به دستگاه های خود وارد نکرده است، اما انتظار می رود iOS 18 شامل تعدادی از ویژگی های جدید هوش مصنوعی باشد و شایعات حاکی از آن است که اپل قصد دارد مدل های زبان بزرگ خود را برای اهداف امنیتی روی دستگاه اجرا کند.

نظر شما درباره مدل هوش مصنوعی متن باز اپل چیه؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.
برای ادامه، شما باید با قوانین موافقت کنید