DeepSeek-V3.2

ベースモデル

開発者

DeepSeek AI

ライセンス

MIT

リリース日

2025/12/1

コンテキスト長

128,000 トークン

対応言語

en, zh

知識カットオフ

2025-Q4

ベースモデル

deepseek-v3-1

officialtext-generationmoesparse-attentioncompetitionopen-source

DeepSeek AIのV3.2モデル。2025年12月1日公開。DeepSeek Sparse Attention（DSA）を導入し、より効率的なアテンション機構を実現。GPT-5/Gemini-3.0-Pro相当の性能。671Bパラメータ（37B活性化）。MITライセンス。

HuggingFace 論文 GitHub 公式サイト

技術仕様

アーキテクチャ

MoE with DeepSeek Sparse Attention (DSA), Efficient long-context attention

パラメータバリエーション

DeepSeek-V3.2(671B)

HuggingFace

DeepSeek Sparse Attention搭載。GPT-5相当の性能。

MoEアクティブパラメータ: 37B

VRAM369GB

GGUFファイルは登録されていません

家系図

現在のモデル: DeepSeek-V3.2

ベース

FT

派生

表示中

DeepSeek-V3.2

技術仕様

アーキテクチャ

パラメータバリエーション

DeepSeek-V3.2(671B)

関連モデル

DeepSeek-LLM

DeepSeek-Coder

DeepSeekMoE

DeepSeek-Math

DeepSeek-VL

DeepSeek-V2

DeepSeek-Coder-V2

DeepSeek-Prover

DeepSeek-V2.5

DeepSeek-V3

DeepSeek-VL2

DeepSeek-R1

Janus

DeepSeek-R1-0528

DeepSeek-V3.1

DeepSeek-Prover-V2

DeepSeekMath-V2

家系図