مدل هوش مصنوعی مترجم گوگل از ۱۰۰۰ زبان مختلف پشتیبانی می‌کند

گوگل درحال توسعه‌ی یک مدل مترجم زبان است که با بهره گرفتن از هوش مصنوعی، از ۱۰۰۰ زبان رایج دنیا پشتیبانی می‌کند. اگرچه این پروژه در مراحل اولیه‌ قرار دارد اما گوگل معتقد است از مزایای آن در اکوسیستم محصولات خود بهره خواهد گرفت.

موبنا – گوگل از پروژه‌ی بلندپروازانه‌ی جدید خود برای توسعه‌ی یک مدل مترجم زبان مبتنی‌بر هوش مصنوعی که از ۱۰۰۰ زبان پرمخاطب در سرتاسر جهان پشتیبانی می‌کند، خبر داده است. این شرکت به‌عنوان اولین گام خود در مسیر ساخت مدل مذکور، یک مدل هوش مصنوعی را با بیش‌از ۴۰۰ زبان آموزش داده است و آن را به‌عنوان بزرگ‌ترین پوشش زبانی که امروزه در یک مدل گفتاری دیده می‌شود، توصیف می‌کند.

زبان و هوش مصنوعی، همیشه در قلب محصولات گوگل قرار داشته‌اند، اما پیشرفت‌های اخیر در یادگیری ماشینی، به‌خصوص توسعه‌ی مدل‌های زبان بزرگ یا LLM قدرتمند و چندمنظوره، تأکید جدیدی روی این حوزه‌ها دارد.

گوگل از مدتی قبل، ادغام مدل‌های زبانی را در محصولاتی مثل سرویس جستجوی خود آغاز کرده است و مشکلات مربوط به عملکرد سیستم‌ها را نیز برطرف می‌کند. مدل‌های زبانی، نقص‌هایی دارند که ازجمله می‌توان به تمایل به بازگرداندن سوگیری‌های مضر اجتماعی مثل نژادپرستی و بیگانه‌هراسی و ناتوانی در تجزیه‌ی زبان براساس حساسیت‌‌های انسانی اشاره کرد. شایان‌ذکر است این شرکت محققان خود را پس‌از انتشار مقالاتی درمورد مشکلات مذکور، اخراج کرد.

اگرچه مدل‌های هوش مصنوعی، قادر به انجام کارهای مختلفی مثل تولید زبان (مثل GPT-3 OpenAI) تا ترجمه (مثل پروژه‌ی No Language Left Behind متا) هستند، اما ابتکار گوگل برای پشتیبانی از ۱۰۰۰ زبان مختلف، روی عملکرد خاصی تمرکز ندارد و درعوض بر ایجاد یک سیستم واحد با وسعت زیاد برای زبان‌های سرتاسر جهان، متمرکز است.

زوبین قهرمانی، معاون ایرانی‌ واحد تحقیقات هوش مصنوعی گوگل در گفت‌وگو با ورج اعلام کرد که این شرکت معتقد است ایجاد مدلی با این ابعاد بزرگ، باعث خواهد شد کارکردهای مختلف هوش مصنوعی، برای زبان‌هایی که در فضاهای آنلاین و مجموعه داده‌های آموزشی هوش مصنوعی، حضور ضعیفی ندارند، آسان‌تر شود. او همچنین به زبان‌هایی که منابع زیادی از آن‌ها وجود ندارد اشاره کرد.

قهرمانی می‌‌گوید:

یک مدل واحد که بسیاری از زبان‌های مختلف را پوشش می‌دهد و روی آن‌ها آموزش داده می‌شود، عملکرد بسیار بهتری برای زبان‌هایی که منابع کمی از آن‌ها وجود دارد، ارائه خواهد داد. روش ما برای پشتیبانی از ۱۰۰۰ زبان مختلف، ساختن ۱۰۰۰ مدل مجزا نیست. زبان‌ها مثل موجودات زنده هستند و از روی یکدیگر تکامل پیدا کرده‌اند؛ درنتیجه شباهت‌هایی میان آن‌ها وجود دارد. به‌هرحال، زمانی‌که داده‌های یک زبان جدید را در مدل ۱۰۰۰ زبانی خود بگنجانیم و توانایی ترجمه‌ از زبان‌های مطرح به زبانی که منابع کمی از آن دردسترس است را داشته باشیم، قادر خواهیم بود به پیشرفت‌های بسیار شگفت‌انگیزی دست یابیم.

تحقیقات گذشته، اثربخشی این رویکرد را نشان داده است و مقیاس مدل برنامه‌ریزی‌شده‌ی گوگل می‌تواند دستاوردهای درخورتوجهی نسبت به تلاش‌های گذشته داشته باشد. چنین پروژه‌هایی درمقیاس بزرگ، به‌نوعی جاه‌طلبی شرکت‌های فناوری برای تسلط بر تحقیقات هوش مصنوعی و استفاده از مزیت‌های منحصربه‌فرد این شرکت‌ها ازنظر دسترسی به حجم عظیمی از قدرت محاسباتی و داده‌های آموزشی را نشان می‌دهند. متا نیز در این زمینه پروژه‌ی مشابهی را برای ساخت یک مترجم جهانی گفتاری آغاز کرده‌ است.

بااین‌حال، دسترسی به داده‌ها هنگام آموزش مدل‌ها برای بسیاری از زبان‌ها، یک مشکل است و گوگل می‌گوید به‌منظور پشتیبانی از کار روی مدل ۱۰۰۰ زبانی، جمع‌آوری داده‌ها را برای زبان‌های کم‌منبع، از ضبط صدا و متون نوشتاری، تأمین می‌کند.

غول جستجوی اینترنت می‌گوید که هیچ برنامه‌ی مستقیمی درمورد مکان استفاده از عملکرد مدل ۱۰۰۰ زبانی خود ندارد و فقط انتظار می‌رود در طیف وسیعی از محصولات این شرکت از سرویس مترجم متن گرفته تا زیرنویس‌های یوتیوب و موارد دیگر، کاربرد داشته باشد.

قهرمانی در بخش دیگری از توضیحات خود گفت:

یکی از نکات واقعاً جالب درمورد مدل‌های زبانی بزرگ و به‌طور کلی، تحقیقات زبانی این است که آن‌ها می‌توانند بسیاری از وظایف مختلف را انجام دهند. همان مدل زبان می‌تواند دستورهای یک ربات را به کد تبدیل کند، می‌تواند مسائل ریاضی را حل یا زبان‌های مختلف را ترجمه کند. ویژگی‌های جالب درمورد مدل‌های زبان این است که درحال تبدیل‌شدن به مخزن عظیمی از دانش هستند و با بررسی آن‌ها به روش‌های مختلف می‌توانید به‌بخش‌های مختلف عملکردهای مفید، دست پیدا کنید.

گوگل مدل ۱۰۰۰ زبانه‌ی خود را برای محصولات جدید مبتنی‌بر هوش مصنوعی خود معرفی کرده است. این شرکت همچنین تحقیقات جدیدی را درمورد مدل‌های تبدیل متن به ویدیو، نمونه‌ی اولیه‌ی دستیار داستان‌نویسی هوش مصنوعی به‌نام Wordcraft و به‌روزرسانی برنامه‌ی AI Test Kitchen خود به‌اشتراک گذاشت؛ برنامه‌ای که امکان دسترسی محدود به مدل‌های هوش مصنوعی این شرکت ازجمله موتور تبدیل متن به‌ تصویر Imagen را برای کاربران فراهم می‌کند.

 منبع: زومیت

نوشته های مشابه

دکمه بازگشت به بالا