GLM-4V-9B
ベースモデル開発者Zhipu AI / Tsinghua UniversityライセンスGLM-4 Licenseリリース日2024/6/5コンテキスト長8,192 トークン対応言語zh, enベースモデルglm-4-9b officialmultimodalvisionbilingual
CogVLM2と同じ学習レシピでGLM-4-9Bをベースに開発。EVA-E (4B)ビジョンエンコーダ採用。1120×1120解像度対応。Visual Expert不採用でモデルサイズを13Bに削減。GLM-4.1V-Thinkingなど派生モデルも展開。
技術仕様
アーキテクチャ
GLM-4-9B + EVA-E (4B) Vision Encoder + 2×2 Downsampling
パラメータバリエーション
標準版。1120×1120解像度対応。バイリンガル。
MoEアクティブパラメータ: 13B
VRAM7.5GB
GGUFファイルは登録されていません
Chain-of-Thought推論搭載。任意アスペクト比対応、最大4K解像度。28ベンチマーク中23タスクで10Bスケール1位。
GGUFファイルは登録されていません
家系図
現在のモデル: GLM-4V-9B
Press enter or space to select a node. You can then use the arrow keys to move the node around. Press delete to remove it and escape to cancel.
Press enter or space to select an edge. You can then press delete to remove it or escape to cancel.