iOS & Android

DeepSeek-R1 svela il nuovo modello “MODEL1” in occasione del suo primo anniversario

BlockBeats notizie, 21 gennaio, secondo i rapporti di QuantumBit, nel primo anniversario del rilascio di DeepSeek-R1, è stato svelato il nuovo modello “MODEL1”. DeepSeek ha aggiornato il codice FlashMLA su GitHub, con MODEL1 menzionato 28 volte in 114 file, comparendo come un modello distinto da V32. È noto che V32 è DeepSeek-V3.2, e MODEL1 è probabilmente una nuova architettura. Le differenze specifiche nel codice si riflettono nel layout della cache KV, nella gestione della sparsità e nella decodifica FP8, con molteplici variazioni nell’ottimizzazione della memoria.