هوش_مصنوعی ۲۰ خرداد ۱۴۰۵

گوگل دیپ‌مایند مدل DiffusionGemma را عرضه کرد؛ هوش مصنوعی محلی ۴ برابر سریع‌تر اجرا می‌شود.

Google DeepMind مدل DiffusionGemma را معرفی کرد؛ این مدل زبانی ۲۶ میلیارد پارامتری به‌صورت Mixture of Experts تنها ۳.۸ میلیارد پارامتر را در زمان استنتاج فعال می‌کند و می‌تواند بلوک‌های متنی را به‌صورت موازی تولید کند. این روش باعث می‌شود سرعت تولید متن تا چهار برابر مدل‌های خودبازگشتی هم‌اندازه شود و برای کارهای غیرخطی مثل حل سودوکو یا ویرایش درون‌خطی مناسب باشد.

چرا مهمه؟

سرعت و کارایی بالاتر در پردازش متن محلی می‌تواند هزینه‌های زیرساختی را کاهش داده و کاربردهای پیشرفته AI را در دستگاه‌های شخصی گسترش دهد.

به درد کی می‌خوره؟

developers, data_scientists, tech_leads, entrepreneurs, general

تو عمل چی کار کنیم؟

توسعه‌دهندگان می‌توانند برنامه‌های تعاملی و پردازش‌های زمان‌حساس را با سرعت چهار برابر نسبت به مدل‌های خودبازگشتی پیاده‌سازی کنند، بدون نیاز به سرورهای پرهزینه.

نظر BlueIT News

DiffusionGemma با تولید هم‌زمان بلوک‌های متنی، مسیر جدیدی برای مدل‌های زبانی باز می‌کند و نشان می‌دهد که رویکردهای غیرخطی می‌توانند کارایی را به‌ویژه در سخت‌افزارهای محلی به‌طور چشمگیری ارتقا دهند.