- 6月 10, 2026
物理ツール使用能力を測る新ベンチマークでMLLMの限界を明らかに
物理ツール使用能力を測る新ベンチマークでMLLMの限界を明らかに 📄 論文サマリー 著者:Zhixin Ma、Yutong Zhou、Yongqi Li、Chong-Wah Ngo、Wenjie Li 発表:arXiv(自然言語処理)/2606.10803v1 公開日:2026年06月09日 ✨ 本論文の新規性 物理ツール使用を評価する初めてのベンチマーク「PhysTool-Bench」を提案 視 […]
物理ツール使用能力を測る新ベンチマークでMLLMの限界を明らかに 📄 論文サマリー 著者:Zhixin Ma、Yutong Zhou、Yongqi Li、Chong-Wah Ngo、Wenjie Li 発表:arXiv(自然言語処理)/2606.10803v1 公開日:2026年06月09日 ✨ 本論文の新規性 物理ツール使用を評価する初めてのベンチマーク「PhysTool-Bench」を提案 視 […]