انتشار مدل زبانی متن باز «توکا» توسط متخصصان مرکز تحقیقات هوش مصنوعی پارت

برای نخستین بار در کشور، شرکت دانش‌بنیان پارت، مدل زبانی BERT large فارسی را با عنوان «توکا» به صورت متن‌باز ارائه کرده است، تا علاقه‌مندان به توسعه ابزارهای هوشمند بتوانند به‌صورت رایگان به آن دسترسی داشته باشند. این مجموعه، علاوه بر نسخه largeاین مدل زبانی، نسخه پایه آن را نیز به صورت متن‌باز در اختیار علاقه‌مندان قرار داده تا مسیر پیشرفت همه فعالان این حوزه هموار شود.

دقت و کیفیت مدل «توکا» که با حجم داده 500 گیگابایت معادل 90 میلیارد توکن توسعه داده شده، تا حدی است که آن را به گزینه‌ای کارآمد برای پیاده‌سازی سرویس‌های فارسی‌زبان تبدیل کرده است. همچنین، قابلیت اجرا و آموزش این مدل بر روی سخت‌افزارهای نه‌چندان قدرتمند، این مدل را به انتخابی مناسب برای پژوهشگران، توسعه‌دهندگان، برنامه‌نویسان و استارتاپ‌های حوزه هوش مصنوعی مبدل کرده است.

انتشار نسخه متن‌باز این مدل زبانی، فرصتی ایجاد می‌نماید تا شرکت‌ها و توسعه‌دهندگان حوزه هوش مصنوعی با استفاده از مدل پایه «توکا»، به راحتی به آموزش و توسعه مدل‌های زبانی بزرگ بپردازند و از سوی دیگر، با اتکا بر آن، محصولات سفارشی‌سازی‌شده، هوشمند و کاملا منطبق با نیازها و خواسته‌های مخاطبان خود را طراحی و ارائه نمایند.

مدل زبانی فارسی «توکا»، پیش‌تر در بسیاری از محصولات هوشمند و خدمات تعاملی شرکت پارت، از جمله سرویس‌های هوشمند ابری سهاب، سرویس تبدیل صوت به متن «آوانگار»، سرویس تبدیل متن به صوت «آواشو»، چت‌بات هوشمند «دانابات» و سرویس تبدیل تصویر به متن «نویسه‌نگار» به کار گرفته شده و عملکرد خوبی از خود به نمایش گذاشته،‌ تا جایی که زمینه استفاده از ابزارهای هوشمند و تعامل آسان‌تر و رضایت‌بخش‌تر با محصولات هوشمند را برای میلیون‌ها کاربر فارسی‌زبان در ایران فراهم آورده است.