CogVLM2
ベースモデル開発者Zhipu AI / Tsinghua UniversityライセンスCogVLM2 License + Llama 3 Licenseリリース日2024/5/20コンテキスト長8,192 トークン対応言語zh, en officialmultimodalvisionvideo
GPT-4Vに匹敵するマルチモーダルモデル。Llama-3-8B-Instructベース。最大1344×1344解像度対応。2×2ダウンサンプリングとVisual Expertを継承。動画理解版(CogVLM2-Video)も提供。
技術仕様
アーキテクチャ
Llama-3-8B-Instruct + Visual Expert + 2×2 Downsampling
パラメータバリエーション
Llama-3-8B-Instructベースの対話版。1344×1344解像度対応。
GGUFファイルは登録されていません
動画理解版。タイムスタンプ付きフレーム入力に対応。
GGUFファイルは登録されていません
家系図
現在のモデル: CogVLM2
Press enter or space to select a node. You can then use the arrow keys to move the node around. Press delete to remove it and escape to cancel.
Press enter or space to select an edge. You can then press delete to remove it or escape to cancel.