Codestral Mamba
指示チューニングofficialcode-generationmambassmlong-contextopen-source
Mamba 2アーキテクチャベースのコードモデル。2024年7月16日公開。State Space Models(SSM)により線形時間推論を実現。理論上無限長シーケンス対応。7Bパラメータで同サイズクラスのモデルを大幅に上回る性能。256Kコンテキスト。入力長に関係なく高速推論。
ベンチマーク
HumanEval
75
mbpp
68.5
spider
58.8
ソース: https://huggingface.co/mistralai/Mamba-Codestral-7B-v0.1
技術仕様
アーキテクチャ
Mamba 2, State Space Models (SSM), Linear-time inference
パラメータバリエーション
関連モデル
Mistral 7B
6 バリエーション
Mixtral 8x7B
2 バリエーション
Mixtral 8x22B
2 バリエーション
Mistral Large
2 バリエーション
Mistral Small
4 バリエーション
Mistral Medium 3
2 バリエーション
Codestral
3 バリエーション
Mathstral
1 バリエーション
Mistral NeMo
2 バリエーション
Pixtral 12B
1 バリエーション
Ministral
2 バリエーション
Pixtral Large
1 バリエーション
Mistral Saba
1 バリエーション
Magistral
2 バリエーション
Voxtral
2 バリエーション
Devstral
5 バリエーション
Mistral Large 3
6 バリエーション
家系図
現在のモデル: Codestral Mamba