پیشرفت چشمگیر در توسعه مدلهای هوش مصنوعی، تنها با صرف ۵۰ دلار

پیشرفت چشمگیر در توسعه مدلهای هوش مصنوعی، تنها با صرف ۵۰ دلار
محققان برای توسعه مدل «اس ۱» از رویکردی به نام «مقیاسگذاری در زمان آزمون» (Test-time scaling) استفاده کردهاند.
این روش شامل افزایش منابع محاسباتی در زمان استنتاج مدل به منظور بهبود عملکرد آن است. به طور خاص، آنها مجموعه دادهای کوچک شامل ۱۰۰۰ سؤال همراه با مسیرهای استدلال و پاسخهای مربوطه را تهیه کردند.
این مجموعه داده با دقت انتخاب شده است تا تنوع و کیفیت بالایی داشته باشد.
پس از تهیه مجموعه داده، مدل پایه با استفاده از این دادهها و با روش «پیشبینی توکن بعدی» آموزش داده شد. فرآیند آموزش تنها ۲۶ دقیقه طول کشید و از ۱۶ واحد پردازش گرافیکی (GPU) مدل H100 استفاده شد.
یکی از نوآوریهای کلیدی در این تحقیق، معرفی تکنیکی به نام «تحمیل بودجه» (Budget forcing) است. این روش به کنترل مدت زمان استدلال مدل در زمان آزمون کمک میکند. به عبارت دیگر، با استفاده از این تکنیک، میتوان مدت زمانی که مدل برای تولید پاسخ صرف میکند را تنظیم کرد. این کار با افزودن یا حذف توکنهای خاصی در خروجی مدل انجام میشود که مدل را ترغیب به ادامه یا خاتمه استدلال میکند.
مدل «اس ۱» در آزمونهای مختلف عملکرد قابلتوجهی نشان داده است. به عنوان مثال، در آزمونهای ریاضی رقابتی مانند MATH و AIME24، این مدل تا ۲۷٪ بهتر از مدل o1 شرکت OpenAI عمل کرده است. این نتایج نشاندهنده کارایی بالای مدل s1 در وظایف استدلالی است.
این تحقیق نشان میدهد که با استفاده از روشهای مناسب و بهینهسازیهای هوشمندانه، میتوان مدلهای هوش مصنوعی کارآمدی را با هزینههای بسیار کمتر توسعه داد. این امر میتواند به دموکراتیزهکردن دسترسی به فناوریهای هوش مصنوعی کمک کند و امکان استفاده از این فناوریها را برای سازمانها و افرادی که منابع محدودی دارند، فراهم سازد.
با توجه به نتایج امیدوارکننده این تحقیق، انتظار میرود که در آینده تحقیقات بیشتری در زمینه مقیاسگذاری در زمان آزمون و تکنیکهای مشابه انجام شود. این تحقیقات میتوانند به توسعه مدلهای هوش مصنوعی با کارایی بالاتر و هزینههای کمتر منجر شوند و کاربردهای جدیدی را در حوزههای مختلف ممکن سازند.