徳島大学 教育・研究者情報データベース(EDB)

Education and Research Database (EDB), Tokushima University

徳島大学ウェブサイトへのリンク

著作: [最上 義夫]/馬場 則夫/反田 幸男/非定常環境中で動作する階層構造学習オートマトンの新しい学習アルゴリズム/[計測自動制御学会論文集]

ヘルプを読む

「著作」(著作(著書,論文,レター,国際会議など))は,研究業績にかかる著作(著書,論文,レター,国際会議など)を登録するテーブルです. (この情報が属するテーブルの詳細な定義を見る)

  • 項目名の部分にマウスカーソルを置いて少し待つと,項目の簡単な説明がツールチップ表示されます.

この情報をEDB閲覧画面で開く

EID
14183
EOID
764184
Map
0
LastModified
2015年1月29日(木) 11:43:00
Operator
三木 ちひろ
Avail
TRUE
Censor
0
Owner
[学科長]/[徳島大学.工学部.知能情報工学科]
Read
継承
Write
継承
Delete
継承
種別 必須 学術論文(審査論文)
言語 必須
招待 推奨
審査 推奨
カテゴリ 推奨
共著種別 推奨
学究種別 推奨
組織 推奨
  1. 徳島大学.工学部.知能情報工学科
著者 必須
  1. 最上 義夫
    役割 任意

    (日) 全頁執筆

    貢献度 任意 80
    学籍番号 推奨
  2. (英) Baba Norio / (日) 馬場 則夫 / (読) ばば のりお
    データベース中に適合する可能性のある以下の情報を発見しました
    [個人] 馬場 則夫 ([大阪教育大学])
    この情報が上記に掲げた個人の業績等に分類されるためには参照登録が必要です.上記に掲げた個人本人に該当する場合には参照登録に変更してください.
    役割 任意
    貢献度 任意
    学籍番号 推奨
  3. (英) Sorida Yukio / (日) 反田 幸男 / (読) そりだ ゆきお
    役割 任意
    貢献度 任意
    学籍番号 推奨
題名 必須

(英) New Algorithm for Hierarchical Sturucture Learning Automata Operating in a Nonstationary Environment

(日) 非定常環境中で動作する階層構造学習オートマトンの新しい学習アルゴリズム

副題 任意
要約 任意

(英) For hierarchical structure learning automata operating in a nonstationary random environment, in this paper, a new learning algorithm is constructed by extending the relative reward strength algorithm proposed by Simha and Kurose. The learning propertiy of our algorithm is considered theoretically, and it is proved that the path probability of the optimal path can be approached 1 as much as possible by using our algorithm. In numerical simulation, the number of iterations of our algorithm is compared with that of the hierarchical structure learning algorithm proposed by Thathachar and Ramakrishnan, and it is shown that our algorithm can find the optimal path after the smaller number of iterations than that of the algorithm of Thathachar and Ramakrishnan.

(日) Relative Reward Strength Algorithmを階層構造学習オートマトンに適用し,新しい階層構造学習アルゴリズムを提案した.各レベルの学習オ-トマトンに対する最新reward vectorを定義し,ある条件のもとでステップサイズパラメータを適切にとると,本階層構造学習アルゴリズムによって,最適パス確率をいくらでも1に近い値にすることができることを示した.また,数値シミュレ-ションにおいては,各確率オ-トマトンがそれぞれ2個の動作をもつレベル数11の階層構造学習オートマトン(パスの総数は2048本)に,本学習アルゴリズムと従来の階層構造学習アルゴリズムの両者を適用することによって,本階層構造学習アルゴリズムが,より少ない学習回数で収束することを確かめた.

キーワード 推奨
  1. (英) hierarchical structure learning automata
    データベース中に適合する可能性のある以下の情報を発見しました
    [キーワード] 階層構造学習オートマトン (hierarchical structure learning automata)
    [キーワード] 可変階層構造学習オートマトン (variable hierarchical structure learning automata)
  2. (英) nonstationary random environment
  3. (英) relative reward strength algorithm
  4. (英) reward vector
発行所 推奨 計測自動制御学会
誌名 必須 計測自動制御学会論文集([計測自動制御学会])
(pISSN: 0453-4654, eISSN: 1883-8189)
ISSN 任意 0453-4654
ISSN: 0453-4654 (pISSN: 0453-4654, eISSN: 1883-8189)
Title: 計測自動制御学会論文集
Supplier: 公益社団法人 計測自動制御学会
Publisher: The Society of Instrument and Control Engineers
 (J-STAGE  (CrossRef (No Scopus information.)
必須 30
必須 8
必須 953 958
都市 任意
年月日 必須 1994年 8月 1日
URL 任意 http://ci.nii.ac.jp/naid/130003970277/
DOI 任意 10.9746/sicetr1965.30.953    (→Scopusで検索)
PMID 任意
NAID 任意 130003970277
WOS 任意
Scopus 任意
評価値 任意
被引用数 任意
指導教員 推奨
備考 任意