Granite Vision 3.2

ベースモデル

開発者

IBM

ライセンス

Apache 2.0

リリース日

2025/2/26

コンテキスト長

128,000 トークン

対応言語

en

officialmultimodalvisiondocument

ドキュメント理解特化のVision Language Model。85Mドキュメントページと26M合成QAペアで学習（DocFM）。DocVQA、ChartQA、OCRBenchでLlama 3.2 11B/Pixtral 12B相当の性能を2Bで達成。

技術仕様

Vision Language Model

表・チャート・図表・インフォグラフィック解析に最適化。5倍大きいモデルと同等性能。

VRAM1.5GB

GGUFファイルは登録されていません

現在のモデル: Granite Vision 3.2

ベース

FT

派生

表示中