TAG

視覚認識

  • 6月 2, 2026

GUI-C²:難易度に応じた強化学習による効率的なGUI操作技術

GUI-C²:難易度に応じた強化学習による効率的なGUI操作技術 📄 論文サマリー 著者:Junlong Li、Chao Hao、Lap-Pui Chau、Yi Wang 発表:arXiv(コンピュータビジョン)/2605.30884v1 公開日:2026年05月29日 ✨ 本論文の新規性 GUI-Dという難易度スコアリング手法を導入し、学習サンプルの質を向上させた。 GUI-C²は粗から細への視 […]

  • 5月 29, 2026

Mags-RLで画像の複雑なシーンを理解する農業AIの新手法

Mags-RLで画像の複雑なシーンを理解する農業AIの新手法 📄 論文サマリー 著者:Xuanzhao Dong、Wenhui Zhu、Peijie Qiu 他11名 発表:arXiv(コンピュータビジョン)/2605.27960v1 公開日:2026年05月27日 ✨ 本論文の新規性 マルチモーダルLLMに外部スーパーレゾリューションエージェントを組み込むことで、複雑な画像認識を強化 強化学習に […]

  • 5月 26, 2026

果物識別に革命をもたらすFruitEnsemble:言語モデルと視覚ensembleの融合

果物識別に革命をもたらすFruitEnsemble:言語モデルと視覚ensembleの融合 📄 論文サマリー 著者:Enhui Yu、Junhui Li、Ruitong Lu、Jialu Li、Youshan Zhang 発表:arXiv(コンピュータビジョン)/2605.20892v1 公開日:2026年05月20日 ✨ 本論文の新規性 306カテゴリの果物を対象とした大規模データセットFrui […]

  • 5月 26, 2026

ストロベリー収穫に特化したロボットシステム:視覚と強化学習で実現する高精度自動収穫

ストロベリー収穫に特化したロボットシステム:視覚と強化学習で実現する高精度自動収穫 📄 論文サマリー 著者:Al Bashir、Shao-Yang Chang、Partho Ghose 他3名 発表:arXiv(ロボティクス)/2605.23863v1 公開日:2026年05月22日 ✨ 本論文の新規性 オクルージョンに強いHRAttnEdge-YOLO26-segモデルを導入し、複雑な農業環境下 […]