徳島大学 教育・研究者情報データベース(EDB)

Education and Research Database (EDB), Tokushima University

徳島大学ウェブサイトへのリンク

著作: [最上 義夫]/馬場 則夫/松下 正樹/P-モデル定常環境のための新しい可変階層構造学習アルゴリズム/[計測自動制御学会論文集]

ヘルプを読む

「著作」(著作(著書,論文,レター,国際会議など))は,研究業績にかかる著作(著書,論文,レター,国際会議など)を登録するテーブルです. (この情報が属するテーブルの詳細な定義を見る)

  • 項目名の部分にマウスカーソルを置いて少し待つと,項目の簡単な説明がツールチップ表示されます.

この情報をEDB閲覧画面で開く

EID
14200
EOID
764220
Map
0
LastModified
2015年1月29日(木) 14:58:48
Operator
三木 ちひろ
Avail
TRUE
Censor
0
Owner
[学科長]/[徳島大学.工学部.知能情報工学科]
Read
継承
Write
継承
Delete
継承
種別 必須 学術論文(審査論文)
言語 必須
招待 推奨
審査 推奨
カテゴリ 推奨
共著種別 推奨
学究種別 推奨
組織 推奨
  1. 徳島大学.工学部.知能情報工学科
著者 必須
  1. 最上 義夫
    役割 任意

    (日) 全頁執筆

    貢献度 任意 80
    学籍番号 推奨
  2. (英) Baba Norio / (日) 馬場 則夫 / (読) ばば のりお
    データベース中に適合する可能性のある以下の情報を発見しました
    [個人] 馬場 則夫 ([大阪教育大学])
    この情報が上記に掲げた個人の業績等に分類されるためには参照登録が必要です.上記に掲げた個人本人に該当する場合には参照登録に変更してください.
    役割 任意
    貢献度 任意
    学籍番号 推奨
  3. (英) Matsushita Masaki / (日) 松下 正樹 / (読) まつした まさき
    役割 任意
    貢献度 任意
    学籍番号 推奨
題名 必須

(英) New Algorithm of Variable Hierarchical Structure Learning Automata for P-model Stationary Random Environment

(日) P-モデル定常環境のための新しい可変階層構造学習アルゴリズム

副題 任意
要約 任意

(英) In this paper, a new learning algorithm for variable hierarchical structure learning automata operating in a P-model stationary random environment is constructed by extending the estimator algorithm proposed by Thathachar and Sastry. The learning propertiy of our algorithm is considered theoretically, and it is proved that the optimal path probability can be approached 1 as much as possible by using our algorithm. In numerical simulation, the average number of iterations of our algorithm is compared with that of the variable hierarchical structure learning algorithm of LR-I type proposed by Mogami and Baba, and it is shown that our algorithm can find the optimal path after the smaller number of iterations than that of the algorithm of LR-I type.

(日) P-モデル定常環境中で動作する全体入出力の可変階層構造学習オートマトンについて考察し,報酬確率のサンプル平均値を用いる可変階層構造学習アルゴリズムを提案した.そして,ある特性を満たす環境のもとでは,初期構造として部分構造を採用するならば,本学習アルゴリズムによって最良目標パスが選択される確率は,学習パラメータを適切に選ぶことによっていくらでも1に近くすることができることを理論的に示した.また,数値シミュレーションによって,本可変階層構造学習アルゴリズムによる学習が,現在時刻の出力と報酬とのみに基づいて学習を行う従来の可変階層構造学習アルゴリズムと比較して少ない学習回数で最良目標パスを見出すことを確認した.

キーワード 推奨
  1. 可変階層構造学習オートマトン(variable hierarchical structure learning automata)
  2. (英) estimator algorithm
  3. (英) reward parameter
  4. (英) sample estimate of reward probability
  5. (英) stationary random environment
発行所 推奨 計測自動制御学会
誌名 必須 計測自動制御学会論文集([計測自動制御学会])
(pISSN: 0453-4654, eISSN: 1883-8189)
ISSN 任意 0453-4654
ISSN: 0453-4654 (pISSN: 0453-4654, eISSN: 1883-8189)
Title: 計測自動制御学会論文集
Supplier: 公益社団法人 計測自動制御学会
Publisher: The Society of Instrument and Control Engineers
 (J-STAGE  (CrossRef (No Scopus information.)
必須 34
必須 3
必須 239 246
都市 任意
年月日 必須 1998年 3月 1日
URL 任意 http://ci.nii.ac.jp/naid/130003791366/
DOI 任意 10.9746/sicetr1965.34.239    (→Scopusで検索)
PMID 任意
NAID 任意 130003791366
WOS 任意
Scopus 任意
評価値 任意
被引用数 任意
指導教員 推奨
備考 任意