『徳島大学 教育・研究者情報データベース (EDB)』---[学外] /
ID: Pass:

登録内容 (EID=14200)

EID=14200EID:14200, Map:0, LastModified:2015年1月29日(木) 14:58:48, Operator:[三木 ちひろ], Avail:TRUE, Censor:0, Owner:[[学科長]/[徳島大学.工学部.知能情報工学科]], Read:継承, Write:継承, Delete:継承.
種別 (必須): 学術論文 (審査論文) [継承]
言語 (必須):
招待 (推奨):
審査 (推奨):
カテゴリ (推奨):
共著種別 (推奨):
学究種別 (推奨):
組織 (推奨): 1.徳島大学.工学部.知能情報工学科 [継承]
著者 (必須): 1.最上 義夫
役割 (任意): (英)   (日) 全頁執筆   [継承]
貢献度 (任意): 80 [継承]
学籍番号 (推奨):
[継承]
2. (英) Baba Norio (日) 馬場 則夫 (読) ばば のりお
役割 (任意):
貢献度 (任意):
学籍番号 (推奨):
[継承]
3. (英) Matsushita Masaki (日) 松下 正樹 (読) まつした まさき
役割 (任意):
貢献度 (任意):
学籍番号 (推奨):
[継承]
題名 (必須): (英) New Algorithm of Variable Hierarchical Structure Learning Automata for P-model Stationary Random Environment  (日) P-モデル定常環境のための新しい可変階層構造学習アルゴリズム   [継承]
副題 (任意):
要約 (任意): (英) In this paper, a new learning algorithm for variable hierarchical structure learning automata operating in a P-model stationary random environment is constructed by extending the estimator algorithm proposed by Thathachar and Sastry. The learning propertiy of our algorithm is considered theoretically, and it is proved that the optimal path probability can be approached 1 as much as possible by using our algorithm. In numerical simulation, the average number of iterations of our algorithm is compared with that of the variable hierarchical structure learning algorithm of LR-I type proposed by Mogami and Baba, and it is shown that our algorithm can find the optimal path after the smaller number of iterations than that of the algorithm of LR-I type.  (日) P-モデル定常環境中で動作する全体入出力の可変階層構造学習オートマトンについて考察し,報酬確率のサンプル平均値を用いる可変階層構造学習アルゴリズムを提案した.そして,ある特性を満たす環境のもとでは,初期構造として部分構造を採用するならば,本学習アルゴリズムによって最良目標パスが選択される確率は,学習パラメータを適切に選ぶことによっていくらでも1に近くすることができることを理論的に示した.また,数値シミュレーションによって,本可変階層構造学習アルゴリズムによる学習が,現在時刻の出力と報酬とのみに基づいて学習を行う従来の可変階層構造学習アルゴリズムと比較して少ない学習回数で最良目標パスを見出すことを確認した.   [継承]
キーワード (推奨): 1.可変階層構造学習オートマトン (variable hierarchical structure learning automata) [継承]
2. (英) estimator algorithm (日) (読) [継承]
3. (英) reward parameter (日) (読) [継承]
4. (英) sample estimate of reward probability (日) (読) [継承]
5. (英) stationary random environment (日) (読) [継承]
発行所 (推奨): 計測自動制御学会 [継承]
誌名 (必須): 計測自動制御学会論文集 ([計測自動制御学会])
(pISSN: 0453-4654, eISSN: 1883-8189)

ISSN (任意): 0453-4654
ISSN: 0453-4654 (pISSN: 0453-4654, eISSN: 1883-8189)
Title: 計測自動制御学会論文集
Supplier: 公益社団法人 計測自動制御学会
Publisher: The Society of Instrument and Control Engineers
 (J-STAGE  (CrossRef (No Scopus information.)
[継承]
[継承]
(必須): 34 [継承]
(必須): 3 [継承]
(必須): 239 246 [継承]
都市 (任意):
年月日 (必須): 西暦 1998年 3月 1日 (平成 10年 3月 1日) [継承]
URL (任意): http://ci.nii.ac.jp/naid/130003791366/ [継承]
DOI (任意): 10.9746/sicetr1965.34.239    (→Scopusで検索) [継承]
PMID (任意):
NAID (任意): 130003791366 [継承]
WOS (任意):
Scopus (任意):
評価値 (任意):
被引用数 (任意):
指導教員 (推奨):
備考 (任意):

標準的な表示

和文冊子 ● 最上 義夫, 馬場 則夫, 松下 正樹 : P-モデル定常環境のための新しい可変階層構造学習アルゴリズム, 計測自動制御学会論文集, Vol.34, No.3, 239-246, 1998年.
欧文冊子 ● Yoshio Mogami, Norio Baba and Masaki Matsushita : New Algorithm of Variable Hierarchical Structure Learning Automata for P-model Stationary Random Environment, Transactions of the Society of Instrument and Control Engineers, Vol.34, No.3, 239-246, 1998.

関連情報

Number of session users = 0, LA = 2.45, Max(EID) = 372561, Max(EOID) = 996460.