TAG

Vision-OPD

  • 5月 26, 2026

Vision-OPDで画像の細部を理解するマルチモーダルLLMの精度向上

Vision-OPDで画像の細部を理解するマルチモーダルLLMの精度向上 📄 論文サマリー 著者:Qianhao Yuan、Jie Lou、Xing Yu 他4名 発表:arXiv(コンピュータビジョン)/2605.18740v2 公開日:2026年05月18日 ✨ 本論文の新規性 マルチモーダルLLMの細部認識を向上させるための自己蒸留手法を提案 外部教師やラベル不要で、モデル自身のCrop条件 […]