Molmo 2
ベースモデル開発者Allen Institute for AI (AI2)ライセンスApache 2.0リリース日2025/12/16コンテキスト長40,960 トークン対応言語en officialopen-sourcemultimodalvisionvideo
ビデオ理解、マルチ画像推論、オブジェクトトラッキングに対応した次世代VLM。GPT-5やGemini 2.5 Proを上回る性能を一部タスクで達成。SigLIP 2ビジョンエンコーダ採用。最大128フレームのビデオ処理。
技術仕様
アーキテクチャ
Vision-Language Model (SigLIP 2 + LLM)
パラメータバリエーション
効率重視版。Qwen3ベース。
GGUFファイルは登録されていません
ビデオグラウンディング・QA最適化版。Qwen3ベース。
GGUFファイルは登録されていません
完全オープン版。OLMoベースでエンドツーエンドオープン。
GGUFファイルは登録されていません
家系図
現在のモデル: Molmo 2
Press enter or space to select a node. You can then use the arrow keys to move the node around. Press delete to remove it and escape to cancel.
Press enter or space to select an edge. You can then press delete to remove it or escape to cancel.