iOS & Android

DeepSeek-R1 lança novo modelo “MODEL1” em seu primeiro aniversário

BlockBeats notícias, 21 de janeiro, de acordo com relatórios da QuantumBit, no primeiro aniversário do lançamento do DeepSeek-R1, o novo modelo “MODEL1” foi revelado. DeepSeek atualizou o código FlashMLA no GitHub, com MODEL1 mencionado 28 vezes em 114 arquivos, aparecendo como um modelo distinto do V32. Sabe-se que V32 é o DeepSeek-V3.2, e MODEL1 é provavelmente uma nova arquitetura. Diferenças específicas no código são refletidas no layout do cache KV, no tratamento de esparsidade e na decodificação FP8, com múltiplas variações na otimização de memória.