iOS & Android

DeepSeek-R1 در اولین سالگرد خود مدل جدید “MODEL1” را معرفی می‌کند

خبر BlockBeats، ۲۱ ژانویه، به گزارش QuantumBit، در نخستین سالگرد انتشار DeepSeek-R1، مدل جدید «MODEL1» رونمایی شده است. DeepSeek کد FlashMLA را در GitHub به‌روزرسانی کرد که در آن MODEL1 در ۱۱۴ فایل، ۲۸ بار ذکر شده و به‌عنوان مدلی متمایز از V32 ظاهر شده است. مشخص است که V32 همان DeepSeek-V3.2 است و MODEL1 احتمالاً یک معماری جدید است. تفاوت‌های مشخص در کد در چیدمان حافظه‌ی پنهان KV، مدیریت پراکندگی و رمزگشایی FP8 منعکس شده است که شامل چندین تغییر در بهینه‌سازی حافظه است.