DeepSeek-VL2
ファインチューニングofficialvisionmultimodalmoeocrdocument-understanding
DeepSeek AIの第2世代Vision-Language MoEモデル。2024年12月13日公開。384x384基本解像度で動的タイリング対応。Tiny(3.37B/1.0B活性化)、Small(16.1B/2.8B活性化)、フル(27.5B/4.5B活性化)の3サイズ展開。OCR、文書理解、チャート分析に強い。
ベンチマーク
mmstar-tiny
45.9
ocrbench-tiny
809
docvqa-tiny
88.9
chartqa-tiny
81
mathvista-tiny
53.6
ソース: https://arxiv.org/abs/2412.10302
技術仕様
アーキテクチャ
Vision-Language MoE, 384x384 base resolution, Dynamic tiling
パラメータバリエーション
DeepSeek-VL2-Tiny(3.37B)
HuggingFace3.37B総パラメータ、1.0B活性化の軽量版。MMStar 45.9、OCRBench 809達成。
MoEアクティブパラメータ: 1.0B
VRAM2GB
GGUFファイルは登録されていません
DeepSeek-VL2-Small(16.1B)
HuggingFace16.1B総パラメータ、2.8B活性化の中型版。
MoEアクティブパラメータ: 2.8B
VRAM9GB
GGUFファイルは登録されていません
DeepSeek-VL2(27.5B)
HuggingFace27.5B総パラメータ、4.5B活性化のフルサイズ版。
MoEアクティブパラメータ: 4.5B
VRAM15GB
GGUFファイルは登録されていません
関連モデル
DeepSeek-LLM
4 バリエーション
DeepSeek-Coder
7 バリエーション
DeepSeekMoE
2 バリエーション
DeepSeek-Math
3 バリエーション
DeepSeek-VL
2 バリエーション
DeepSeek-V2
4 バリエーション
DeepSeek-Coder-V2
4 バリエーション
DeepSeek-Prover
1 バリエーション
DeepSeek-V2.5
1 バリエーション
DeepSeek-V3
2 バリエーション
DeepSeek-R1
8 バリエーション
Janus
3 バリエーション
DeepSeek-R1-0528
1 バリエーション
DeepSeek-V3.1
1 バリエーション
DeepSeek-Prover-V2
2 バリエーション
DeepSeekMath-V2
1 バリエーション
DeepSeek-V3.2
1 バリエーション
家系図
現在のモデル: DeepSeek-VL2