شرکتی چینی رقیب هوش مصنوعی GPT-4 را با تنها ۲ هزار پردازنده گرافیکی توسعه داد

کای-فو لی، بنیان‌گذار و مدیرعامل استارتاپ ai.01 در مصاحبه‌ای اعلام کرد که شرکتش یکی از مدل‌های هوش مصنوعی پیشرفته‌ی خود را با استفاده از دو هزار پردازنده‌ی گرافیکی و تنها با سه میلیون دلار آموزش داده است.

در ویدیوی منتشرشده در ایکس، کای-فو لی گفت: «چیزی که دوستان من در سیلیکون‌ولی را شگفت‌زده می‌کند عملکرد ما نیست، بلکه این است که ما مدل را تنها با سه میلیون دلار آموزش داده‌ایم؛ در حالی که GPT-4 با هزینه‌ای بالغ‌بر ۸۰ تا ۱۰۰ میلیون دلار آموزش دیده و شایعه شده است که GPT-5 با هزینه‌ای حدود یک میلیارد دلار آموزش داده می‌شود.»

مدیر ai.01 به محدودیت‌های دسترسی چین به فناوری‌های روز دنیا مانند پردازنده‌های گرافیکی پرقدرت انویدیا که قلب تپنده‌ی بسیاری از سرورهای هوش مصنوعی را تشکیل می‌دهند اشاره کرد و افزود: «به‌عنوان یک شرکت چینی، دسترسی ما به GPUها به دلیل تحریم‌های ایالات متحده محدود است. علاوه‌بر این، شرکت‌های چینی به اندازه‌ی شرکت‌های آمریکایی ارزش‌گذاری نمی‌شوند.»

کای-فو لی می‌گوید که تیم او فقط دو هزار پردازنده‌ی گرافیکی در دست داشتند تا بتوانند مدل هوش مصنوعی خود را توسعه دهند و خود او می‌باید اولویت‌بندی‌های درستی را به‌عنوان مدیرعامل انجام می‌داد. طبق فهرست موجود در وب‌سایت ai.01، مدل Yi-Lightning در رتبه‌ی ششم براساس معیار عملکرد LMSIS در دانشگاه برکلی قرار دارد.

دستاورد استارتاپ چینی به‌دلیل کاهش خیره‌کننده‌ی هزینه‌ها قابل توجه است. تفاوت چشمگیر نشان می‌دهد که دستیابی به قابلیت‌های پیشرفته‌ی AI، همیشه نیاز به بودجه‌های کلان ندارد و مهندسی دقیق و بهینه‌سازی هدفمند می‌تواند نتایج مشابهی را با هزینه و منابع محاسباتی کمتر به بار آورد.

مقاله‌های مرتبط

گفته می‌شود که OpenAI برای آموزش مدل GPT-3 خود از ۱۰ هزار پردازنده‌ی گرافیکی A100 انویدیا استفاده کرده و برای آموزش مدل‌های GPT-4 و GPT-4o از تعداد بسیار بیشتری پردازنده‌ی H100 بهره برده است. قیمت هر پردازنده‌ی H100 حدود ۳۰ هزار دلار است و هزینه‌ی دو هزار عدد از آن‌ها ۶ میلیون دلار خواهد بود. بنابراین به‌نظر می‌رسد چینی‌ها از پردازنده‌های ارزان‌تری استفاده کرده‌اند.

کای-فو لی افزود: «ما باید روند آموزش و استنتاج مدل را تسریع می‌کردیم. بنابراین، استنتاج ما به گونه‌ای طراحی شده است که تنگناها را با تلاش برای تبدیل مسئله‌ی محاسباتی به مسئله‌ی حافظه‌ای، ساخت کش چندلایه، ایجاد یک موتور استنتاج خاص و موارد دیگر در کل فرآیند شناسایی کند. اما نکته‌ی اصلی این است که هزینه‌ی استنتاج مدل ما ۱۰ سنت به‌ازای هر میلیون توکن است (هزینه‌ی هر ۱٬۰۰۰ توکن در GPT-4 به ۰٫۰۳ دلار می‌رسد).»

حتما بخوانید : هوش مصنوعی جدید ناسا، به پرسش‌های شما درباره کره زمین پاسخ می‌دهد