BlockBeats news, 21 de enero, según informes de QuantumBit, en el primer aniversario del lanzamiento de DeepSeek-R1, se ha presentado el nuevo modelo «MODEL1». DeepSeek actualizó el código FlashMLA en GitHub, donde MODEL1 se menciona 28 veces en 114 archivos, apareciendo como un modelo distinto de V32. Se sabe que V32 es DeepSeek-V3.2, y MODEL1 probablemente sea una nueva arquitectura. Las diferencias específicas en el código se reflejan en el diseño de la caché KV, el manejo de la dispersión y la decodificación FP8, con múltiples variaciones en la optimización de memoria.
