iOS & Android

DeepSeek-R1 dévoile son nouveau modèle « MODEL1 » pour son premier anniversaire

BlockBeats, 21 janvier – Selon des informations rapportées par QuantumBit, à l’occasion du premier anniversaire de la sortie de DeepSeek-R1, le nouveau modèle « MODEL1 » a été dévoilé. DeepSeek a mis à jour le code FlashMLA sur GitHub, où MODEL1 est mentionné 28 fois dans 114 fichiers, apparaissant comme un modèle distinct de V32. On sait que V32 correspond à DeepSeek-V3.2, et MODEL1 est probablement une nouvelle architecture. Les différences spécifiques dans le code se reflètent dans l’organisation du cache KV, le traitement de la parcimonie et le décodage FP8, avec de multiples variantes en matière d’optimisation de la mémoire.