گوگل دیپمایند مدل DiffusionGemma را عرضه کرد؛ هوش مصنوعی محلی ۴ برابر سریعتر اجرا میشود.
Google DeepMind مدل DiffusionGemma را معرفی کرد؛ این مدل زبانی ۲۶ میلیارد پارامتری بهصورت Mixture of Experts تنها ۳.۸ میلیارد پارامتر را در زمان استنتاج فعال میکند و میتواند بلوکهای متنی را بهصورت موازی تولید کند. این روش باعث میشود سرعت تولید متن تا چهار برابر مدلهای خودبازگشتی هماندازه شود و برای کارهای غیرخطی مثل حل سودوکو یا ویرایش درونخطی مناسب باشد.

چرا مهمه؟
سرعت و کارایی بالاتر در پردازش متن محلی میتواند هزینههای زیرساختی را کاهش داده و کاربردهای پیشرفته AI را در دستگاههای شخصی گسترش دهد.
به درد کی میخوره؟
developers, data_scientists, tech_leads, entrepreneurs, general
تو عمل چی کار کنیم؟
توسعهدهندگان میتوانند برنامههای تعاملی و پردازشهای زمانحساس را با سرعت چهار برابر نسبت به مدلهای خودبازگشتی پیادهسازی کنند، بدون نیاز به سرورهای پرهزینه.
نظر BlueIT News
DiffusionGemma با تولید همزمان بلوکهای متنی، مسیر جدیدی برای مدلهای زبانی باز میکند و نشان میدهد که رویکردهای غیرخطی میتوانند کارایی را بهویژه در سختافزارهای محلی بهطور چشمگیری ارتقا دهند.