本研究では難易度の高い全身運動の教示方法を明らかにするため、強化学習による教示アルゴリズムを提案し、実際のヒューマノイドロボットを用いて検証することを目的とした。研究期間中にカルバック・ライブラー制御と呼ばれる確率最適制御理論に基づく新しい運動教示方法を考案した。提案手法の有効性は本プロジェクトで整備された双腕マニピュレータによって実証された。さらに、教師とロボットの共有潜在空間を利用することで低次元空間内で最適方策を高速に学習する方法を提案し、ヒューマノイドロボットのシミュレーションにおいて有効性を示した。