<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>論文掲載 | 堀井隆斗 | 大阪大学</title><link>https://www.takatohorii.jp/tags/%E8%AB%96%E6%96%87%E6%8E%B2%E8%BC%89/</link><atom:link href="https://www.takatohorii.jp/tags/%E8%AB%96%E6%96%87%E6%8E%B2%E8%BC%89/index.xml" rel="self" type="application/rss+xml"/><description>論文掲載</description><generator>HugoBlox Kit (https://hugoblox.com)</generator><language>ja</language><lastBuildDate>Thu, 21 May 2026 00:00:00 +0000</lastBuildDate><image><url>https://www.takatohorii.jp/media/icon_hu_da05098ef60dc2e7.png</url><title>論文掲載</title><link>https://www.takatohorii.jp/tags/%E8%AB%96%E6%96%87%E6%8E%B2%E8%BC%89/</link></image><item><title>IEEE Accessに論文が採択・公開されました（モバイルマニピュレーション向け距離認識世界モデル強化学習）</title><link>https://www.takatohorii.jp/blog/ieee-access-distance-aware-world-model/</link><pubDate>Thu, 21 May 2026 00:00:00 +0000</pubDate><guid>https://www.takatohorii.jp/blog/ieee-access-distance-aware-world-model/</guid><description>&lt;p&gt;Xiaoxu Fengさん（博士後期課程）と堀井隆斗による論文 &amp;ldquo;Distance-Aware World Model-based Reinforcement Learning for Mobile Manipulation Behaviors&amp;rdquo; が、&lt;em&gt;IEEE Access&lt;/em&gt; に採択され、Early Accessとしてオープンアクセス（CC-BY）で公開されました。&lt;/p&gt;
&lt;p&gt;本研究では、移動マニピュレーション（mobile manipulation）における身体性選択（embodiment selection）と動作計画（motion planning）の双方を、ひとつの世界モデルベースの強化学習フレームワークに統合的に扱う手法を提案しています。具体的には、潜在状態の類似度に依存していた従来の報酬設計の限界を克服するため、3次元空間情報を世界モデルに明示的に組み込み、距離を意識した報酬（distance-aware reward）を導出します。高レベルの身体性選択にはreachability報酬を併用することで、移動と腕動作の切り替えを合理的に行うエンドツーエンド学習を実現しました。シミュレーション評価では、固定／ランダム目標位置のいずれにおいても従来の類似度報酬を大きく上回る成功率を達成しています。&lt;/p&gt;
&lt;p&gt;本研究はJST Moonshot R&amp;amp;D（JPMJMS2011）の支援を受けて実施されました。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;著者：Xiaoxu Feng, Takato Horii（大阪大学 大学院基礎工学研究科）&lt;/li&gt;
&lt;li&gt;掲載誌：&lt;em&gt;IEEE Access&lt;/em&gt;（Early Access, 2026年5月21日）&lt;/li&gt;
&lt;li&gt;DOI：
&lt;/li&gt;
&lt;li&gt;論文：
&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>