軽量VLMのMiniCPM-V2.6のColaboratoryサンプルです。
このノートブックでは以下のサンプルを実行できます。
- 画像認識でのマルチターンチャット
- 複数画像認識
- 動画認識
- コンテキスト内でのフューショット学習
Colaboratoryでノートブックを開き、上から順に実行してください。
※openbmb/MiniCPM-V-2_6 を使用する場合、L4 GPU以上のGPUが必要
openbmb/MiniCPM-V-2_6-int4 を使用する場合、T4 GPU以上のGPUが必要
高橋かずひと(https://twitter.com/KzhtTkhs)
MiniCPM-V2.6-Colaboratory-Sample is under Apache 2.0 License.
サンプル画像はぱくたそ様の以下画像を使用しています。
- テレビゲームで遊ぶ子どもたち
- まったく盛り上がらない無反応パーティーをご覧ください
- 急な展開で思わず反応してしまう男女
- 「S」のアルファベット(人文字)
- 「G」のアルファベット(人文字)
- 「U」のアルファベット(人文字)
サンプル動画はNHKクリエイティブ・ライブラリー様の以下動画を使用しています。