iOS & Android

DeepSeek-R1、設立1周年を機に新モデル「MODEL1」を発表

BlockBeatsニュース、1月21日、QuantumBitの報道によると、DeepSeek-R1のリリース1周年を記念し、新モデル「MODEL1」が公開されました。DeepSeekはGitHub上でFlashMLAコードを更新し、114ファイル中28回にわたりMODEL1が言及されており、V32とは異なる独立したモデルとして登場しています。V32はDeepSeek-V3.2であることが知られており、MODEL1は新たなアーキテクチャである可能性が高いとされています。コード上の具体的な差異は、KVキャッシュの配置、スパース性の処理、FP8デコードなどに現れており、メモリ最適化において複数のバリエーションが確認されています。