عینک مترجم واقعیت افزوده گوگل؛ پروژهای واقعی یا خیالی؟
نمیدانم Google I/O امسال را تماشا کردید یا جمعبندی lastech از کل این رویداد را خواندید یا خیر. این مراسم که پس از دو سال از شروع همهگیری دوباره به روی صحنه مانتینویو بازگشته بود، پربارتر و هیجانانگیزتر از سالهای گذشته بود و درکنار خبرهای نرمافزاری و قابلیتهای جدید جستجو، از Scene Exploration گرفته تا تشخیص هوشمند رنگ پوست، بخش زیادی را به معرفی محصولات سختافزاری و کاربرمحور از جمله پیکسل 6a، پیکسل واچ و پیکسل تبلت اختصاص داد.
اما در پایان مراسم، گوگل سورپرایز دیگری را رو کرد که بلندپروازانهترین و بهنظرم، آیندهنگرانهترین و هیجانانگیزترین محصول معرفیشده گوگل در این رویداد بود؛ عینک مترجم!
- در رویداد Google I/O 2022 چه گذشت؛ از اندروید ۱۳ تا عینک مترجم [بههمراه ویدئو]
گوگل در ویدئوی کوتاهی، از عینک واقعیت افزودهای رونمایی کرد که تنها یک قابلیت دارد و آن نمایش ترجمهی صحبتهای افراد درست در گسترهی دید کاربری است که عینک به چشم دارد. در این ویدئوی احساسی که در پایین آن عبارت «نمایش شبیهسازیشده» درج شده بود، مادر و فرزندی را دیدیم که برای اولین بار توانستند حرف یکدیگر را بفهمند. همچنین فردی را دیدیم که داشت به زبان اشاره صحبت میکرد و ترجمهی حرفهایش به زبان انگلیسی برای کسی که عینک گوگل را به چشم داشت، بهصورت واقعیت افزوده و زنده بهنمایش درمیآمد. مدیر محصول گوگل قابلیت ترجمهی زنده این عینک را «زیرنویسی برای دنیا» توصیف و ما را برای مدت کوتاهی در تصور آیندهای زیباتر از آنچه معمولاً انتظارش را داریم، غرق کرد.
اما چقدر این تصور عملی است و چقدر با این آینده فاصله داریم؟ آنقدری که شاید به عمر ما نرسد یا زیر انبوه پروژههای رهاشدهی گوگل دفن شود؟
همین که گوگل تصمیم گرفته این عینک را تنها به یک قابلیت و آن هم قابلیتی که ۱۶ سال در حال بهبود آن است، مجهز کند، تصمیم بسیار هوشمندانهای بوده و ما را کمی به آیندهی آن امیدوار میکند. بااینحال، گوگل ترنسلیت اگرچه ابزار بسیار کاربردی و حیرتانگیزی است که در مواقع اضطراری، به کمکمان آمده است، در عین حال به مراتب پیش آمده که اشتباهات خجالتآور زیادی در ترجمه انجام دهد. شاید در حد احوالپرسی و پرسیدن آدرس بتوان به ترجمهی گوگل ترنسلیت اعتماد کرد، اما بههیچوجه نمیتوان از درستی ترجمهی داستانهای کلاسیک یا ضربالمثلها و جملات پیچیده آن هم از زبانهای غیراروپایی مطمئن بود.
سال ۲۰۱۷ نیز گوگل زمانی که داشت برای نسل اول پیکسل بادز تبلیغ میکرد، روی قابلیت ترجمهی زنده آن مانور زیادی داد. البته افرادی که تجربهی استفاده از این هدفون را داشتند، قابلیت ترجمهی زندهی آن را ایدهای تحسینبرانگیز اما با پیادهسازی تأسفبار توصیف کردند. ظاهراً توانایی این هدفون در ترجمهی مکالمهی افراد در حدی بود که احساس میکردید یک کودک پنجساله در حال صحبت با شما است و این تجربه با آنچه گوگل آن زمان در ویدئوی تبلیغاتی پیکسل بادز نمایش داده بود، زمین تا آسمان تفاوت داشت.
مشکلات و چالشهای گوگل در زمینهی ترجمه به کنار، این شرکت وعده داده که ترجمه قرار است داخل عینک واقعیت افزوده صورت گیرد؛ حوزهی دیگری که گوگل از سال ۲۰۱۲ همچنان با آن درگیر است و هنوز نتوانسته حتی ۱۰ درصد از آنچه را که در ویدئوی مفهومی گوگل گلس که آن زمان نشان داده بود، به واقعیت تبدیل کند. در این ویدئو، گوگل وعدههای شگفتانگیز و بلندپروازنهای میدهد؛ تماشا و تعامل با تمام اپلیکیشنهای کاربردی گوشیهای هوشمند مثل یادآوریها، پیامها، ساعت و گزارش آبوهوا، گزارش لحظهای از وضعیت مترو و فلشهای مسیریابی و تماس ویدئویی و ثبت عکس و آپلود آن در شبکههای اجتماعی، همه و همه درست در فضای جلوی چشمان کاربر و بهکمک گوگل گلس انجام میشود. اما این پروژه به جایی نرسید و به یک شکست تمامعیار برای گوگل تبدیل شد، بهطوری که تا چند سال سراغی از آن نگرفت.
البته عینک مترجم گوگل از پروژهی نافرجام گلس متمرکزتر است و فقط قرار است یک کار را انجام دهد که این موضوع، وعدهی این شرکت بدسابقه را کمی باور پذیرتر میکند. چیزی که گوگل به ما نشان داد عینکی بود که فقط قرار است متن ترجمهشده را نمایش دهد نه اینکه تمام کارهای یک گوشی هوشمند را یکجا به عهده بگیرد؛ اما انجام همین یک وظیفه چقدر امکانپذیر است، بهخصوص در شرایطی که گوگل هنوز هیچ توضیحی دربارهی سازوکار این عینک ارائه نداده است؟
حقیقت این است که ساخت عینکهای واقعیت افزوده اصلاً کار آسانی نیست. اگر در محیطی باشید که میزان نور فقط کمی زیاد باشد، نمیتوانید بهراحتی متنها را بخوانید. حتی خواندن زیرنویس از روی نمایشگر تلویزیون وقتی نور مستقیم خورشید به آن تابیده است، بسیار چالشبرانگیز میشود؛ چه برسد به اینکه بخواهیم این تجربه را روی نمایشگری چسبیده به صورت و آن هم زمانی که مشغول صحبت با کسی هستیم که زبانش را نمیفهمیم، داشته باشیم.
البته این را هم باید قبول داشت که تکنولوژی با سرعت در حال پیشرفت است و گوگل ممکن است بتواند تا چند سال دیگر از پس چالشهای کنونی برآید. اما این حقیقت هنوز پا بر جا است که گوگل ترنسلیت به حدی پیشرفت نکرده تا بتوان با آن ترجمهی دقیق و کاملاً درستی از مکالمات انجام داد؛ چطور میتوان انتظار ترجمهای روان را در عینک واقعیت افزودهی این شرکت داشت؟
البته همانطور که موقع صحبت کردن با الکسا، سیری یا گوگل اسیستنت از فرمانهای صوتی مشخص و سادهتری استفاده میکنیم تا برای هوش ماشینی قابل فهم باشد، هنگام استفاده از ابزار ترجمه نیز ممکن است از جملات ساده و واضحتری استفاده کنیم. اما در سادهترین حالت هم عملکرد گوگل ترنسلیت در حد انتظار نبوده است. مثلاً یکی از افراد مسلط به زبان کرهای عنوان کرد که در ویدئوی شمارش معکوس رویداد I/O گوگل، از کلمهای برای «خوش آمدید» استفاده شده بود که هیچ کرهای زبانی از آن استفاده نمیکند.
تازه این اشتباه پیشوپاافتادهای است؛ زمانی که گوگل داشت با آبوتاب از اضافه شدن ۲۴ زبان جدید به ترنسلیت صحبت میکرد، اشتباه بزرگتر و نابخشودنیتری افتاد! در نمایشگر پشت سر سوندار پیچای، مدیر عامل گوگل، نام زبانهایی که با الفبای عربی نوشته شده بودند، بهصورت جدا از هم و برعکس و کاملاً نامفهوم تایپ شده بود. حتی یکی از کاربران عربی زبان در توییتر با منشن کردن پیچای، به گوگل طعنه انداخت و گفت: «استارتاپهای کوچک و مستقلی چون گوگل بودجه کافی برای استخدام کسی که سواد نوشتن به زبان عربیاش در حد دانش آموز دبستانی باشد، ندارند.» راستش ما توقع تجربهای صددرصد بیعیب و نقص از محصولات گوگل نداریم؛ اما برای شرکتی که بهسختی در تلاش است ما را قانع کند چیزی نمانده تا ترجمهی زنده را به عینکهای واقعیت افزوده بیاورد، پیش آمدن چنین اشتباهات خجالتآوری، باورپذیری ادعای گوگل را زیر سؤال میبرد.
گوگل درحالی از اضافه شدن ۲۴ زبان جدید به ترنسلیت خبر داد که نام برخی از آنها اشتباه نوشته شده بود.
واضح است که گوگل سعی در حل مشکلی بینهایت پیچیده را دارد. ترجمهی کلمات آسان است، فهم گرامر دشوار اما شدنی است؛ اما زبان و مکالمه بسیار پیچیدهتر از کلمات و گرامر هستند. مثلاً افرادی که چند زبانه هستند، گاهی هنگام صحبت به یک زبان، از کلمات زبان دیگر استفاده میکنند. فکر میکنید عینک مترجم گوگل بتواند از پس ترجمهی این مدل مکالمه برآید؟ تازه داستان زمانی که پای جملات نیمهکاره، دوپهلو، ضربالمثلها و ارجاعات گنگ به میان میآید، پیچیدهتر میشود.
البته گوگل در رقابت عینکهای واقعیت افزوده تنها نیست. شرکت متا تاکنون میلیاردها دلار برای توسعهی عینکهای AR خرج کرده و تعداد کارمندان بخش سختافزار و نرمافزار متاورسی آن بهحدود ۱۸ هزار نفر افزایش یافته که فقط در سال گذشته بیش از ۱۰ میلیارد دلار برای این شرکت هزینه داشته است. نقشهی راه متا برای عرضهی این عینکها که البته از عینک مترجم گوگل بلندپروازانهتر بهنظر میرسند، از سال ۲۰۲۴ تا ۲۰۲۶ تعیین شده؛ اما بسیار بعید است تا چند سال دیگر شاهد تکنولوژیای باشیم که بتواند فردی را بهشکل هولوگرام جلوی ما بنشاند تا با هم شطرنج بازی کنیم.
با تمام این حرفها، برنامه گوگل برای عرضهی عینک مترجم کاملاً تحسینبرانگیز است و من بیصبرانه منتظر روزی هستم که تمام افراد بتوانند مانند مادر و فرزند ویدئوی گوگل، بدون هیچ مشکلی حرف همدیگر را بفهمند. اما تا رسیدن آن روز و فراگیر شدن استفاده از عینکهای واقعیت افزوده، راه درازی در پیش است و بعید میدانم تلاشهای اولیهی گوگل برای عرضهی این عینک بهاندازهی ویدئویی که در رویداد I/O تماشا کردیم، رضایتبخش باشد.