TAG

視覚言語モデル

  • 5月 26, 2026

視覚言語モデルを活用した自動運転の3D車両ラベリング精度向上手法

視覚言語モデルを活用した自動運転の3D車両ラベリング精度向上手法 📄 論文サマリー 著者:Steven Chen、Shivesh Khaitan、Nemanja Djuric 発表:arXiv(コンピュータビジョン)/2605.21747v1 公開日:2026年05月20日 ✨ 本論文の新規性 視覚言語モデル(VLM)を用いて車両のメーカー・モデル・世代を推論し、3Dボックス寸法を推定する新しいア […]