
اپل جزئیات مربوط به مدل هوش مصنوعی MM1 را منتشر کرد
- اخبار تکنولوژی
- مطالعه 4 دقیقه

پژوهشگران اپل روش جدیدی برای آموزش مدلهای زبان بزرگ (LLM) توسعه دادهاند که اطلاعات متنی و تصویری را به طور یکپارچه ادغام میکند. در ادامه با آلفا لیکز در بررسی جزئیات مدل هوش مصنوعی MM1 همراه باشید.
یافتههای این شرکت، که در مقالهای تحقیقاتی با عنوان “MM1: روشها، تجزیه و تحلیل و بینش از پیشآموزش چندرسانهای LLM” شرح داده شده است، رویکرد جدیدی را برای ایجاد سیستمهای هوش مصنوعی هوشمندتر و انعطافپذیرتر نشان میدهد. اپل با استفاده از مجموعه دادههای متنوعی که شامل شرح تصویر، اسناد متنی تصویری درهم آمیخته و دادههای صرفا متنی میشود، ادعا میکند که مدل هوش مصنوعی MM1 استاندارد جدیدی را در توانایی هوش مصنوعی برای انجام کارهایی مانند شرح تصویر، پاسخ به سوالات تصویری و استنتاج زبان طبیعی با دقت بالا تعیین میکند.
تحقیقات اپل بر ترکیب انواع مختلف دادههای آموزشی و معماریهای مدل تمرکز دارد که به هوش مصنوعی این امکان را میدهد تا زبان را بر اساس ترکیبی از نشانههای بصری و زبانی درک و تولید کند. این قابلیت برای وظایفی که نیاز به درک ظریف از جهان دارند، مانند تفسیر تصاویر پیچیده یا پاسخ به سوالاتی که شامل عناصر بصری هستند، حیاتی است.
این مقاله همچنین بر تواناییهای یادگیری استثنایی در متن مدل MM1، به ویژه در بزرگترین پیکربندی پارامتر 30 میلیارد مدلی آن، تأکید میکند. این نسخه به طور ظاهری قابلیتهای قابل توجهی را برای استدلال چند مرحلهای بر روی چندین تصویر با استفاده از تکنیک “زنجیره تفکر” چند نمونهای نشان میدهد. تکنیکی که به هوش مصنوعی اجازه میدهد تا بر اساس حداقل نمونهها، حل مسئله پیچیده و باز را انجام دهد.
این تحقیق به عنوان بخشی از ابتکار گستردهتر اپل برای تقویت قابلیتهای هوش مصنوعی خود در بحبوحه رقابت فزاینده این تکنولوژی منتشر شده است. مارک گورمن از بلومبرگ گزارش داده است که اپل در حال مذاکره با گوگل جهت ارائه مجوز جهت استفاده از مدل زبانی بزرگ Gemini گوگل برای استفاده و قدرت دادن به ویژگیهای جدیدی است که به عنوان بخشی از ویژگی های iOS 18 به آیفون ها اضافه خواهند شد.
نظر شما درباره جزئیات مدل هوش مصنوعی MM1 چیه؟
جدیدترین مطالب
در آلفا لیکز ثبت نام کنید
برای دسترسی به تمام امکانات و بخش های سایت “عضو آلفا لیکز” بشید