iOS & Android

DeepSeek-R1 enthüllt neues Modell „MODEL1“ zu seinem ersten Jahrestag

BlockBeats Nachrichten, 21. Januar, laut QuantumBit Berichten wurde zum ersten Jahrestag der Veröffentlichung von DeepSeek-R1 das neue Modell „MODEL1“ enthüllt. DeepSeek aktualisierte den FlashMLA-Code auf GitHub, wobei MODEL1 28 Mal in 114 Dateien erwähnt wird und als eigenständiges Modell neben V32 auftaucht. Es ist bekannt, dass V32 DeepSeek-V3.2 ist und MODEL1 wahrscheinlich eine neue Architektur darstellt. Spezifische Unterschiede im Code spiegeln sich im KV-Cache-Layout, der Sparsity-Verarbeitung und der FP8-Decodierung wider, mit mehreren Variationen bei der Speicheroptimierung.