制御の抽出

Oztop, et al. 川人先生の研究(模倣)
ロボットハンドでBall Swapping Taskでの制御器を抽出する研究。
Dexterous Skills Transfer by Extending Human Body Schema to a Robotic Hand

http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4115584

Nikolay Jetchev, et al. “Task Space Retrieval Using Inverse Feedback Control” PDF
単語
デモンストレーションデータから潜在コスト関数fを同定する方法について。
状態変数n個(関節及び対象物体の三次元位置)があるとして、組み合わせn*(n-1)個の組み合わせ(a, b)を取ってきて、それぞれで{a基準でのbの位置及び、aから測ったbの距離}の4次元ベクトルを作る。つまり、4*n*(n-1)次元の高次元特徴量を中間に構成する。
学習は、2層3層混成のニューラルネットワークの重みを、デモンストレーションにより計算可能なTRICのLossで最小化したものを、fのパラメータとして用いる。(この運動では3層にする意味がないという結果であった)
制御は、fの最急降下方向に分解速度制御を行う。
少数のデモンストレーションデータにより実現可能である。(3-27回くらい)
限界として、単発の運動にしか適用できず、周期運動が不可能である点と、ノイズに弱い点である。

Ratriff, et al. “Maximum Margin Planning” PDF
IOCの解説でNikolayさんが引いていたから、きっとIOCの解説が載っているはず。

Yann LeCun, et al.”A Tutorial on Energy-Based Learning” PDF
Discriminative Learningの解説でNikolayさんが引いていたから、きっとDiscriminative Learningの解説が載っているはず。

冗長系におけるフィードフォワード制御
“Feed-forward control of a redundant motor system” PDF

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>