خبر BlockBeats، ۲۱ ژانویه، به گزارش QuantumBit، در نخستین سالگرد انتشار DeepSeek-R1، مدل جدید «MODEL1» رونمایی شده است. DeepSeek کد FlashMLA را در GitHub بهروزرسانی کرد که در آن MODEL1 در ۱۱۴ فایل، ۲۸ بار ذکر شده و بهعنوان مدلی متمایز از V32 ظاهر شده است. مشخص است که V32 همان DeepSeek-V3.2 است و MODEL1 احتمالاً یک معماری جدید است. تفاوتهای مشخص در کد در چیدمان حافظهی پنهان KV، مدیریت پراکندگی و رمزگشایی FP8 منعکس شده است که شامل چندین تغییر در بهینهسازی حافظه است.
