○種別 (必須): | □ | 先端技術科学教育部 (授業概要)
| [継承] |
○入学年度 (必須): | □ | 西暦 2010年 (平成 22年)
| [継承] |
○名称 (必須): | □ | (英) Autonomous Intelligent Systems (日) 自律知能システム (読) じりつちのうしすてむ
| [継承] |
○形態 (推奨): | 1. | 講義
| [継承] |
○コース (必須): | 1. | 2010/[徳島大学.先端技術科学教育部.システム創生工学専攻.知能情報システム工学コース]/[博士前期課程]
| [継承] |
○担当教員 (必須): | 1. | 小野 典彦
○肩書 (任意): | □ | 教授 ([教職員.教員.本務教員]/[常勤])
| [継承] |
| [継承] |
| 2. | 最上 義夫
| [継承] |
○単位 (必須): | □ | 2
| [継承] |
○目的 (必須): | □ | (英) As effective design methods of autonomous intelligent systems, the reinforcement learning algorithms have received much attention that allow the systems to obtain appropriate decision policies by trial and error even in environments with delayed rewards. This class provides the basic concepts and theories concerning the algorithms as well as their application techniques. (日) 自律的な知能システムの設計方法論として,報酬に遅れのある環境におかれながらも自らの行動政策を試行錯誤的に最適化可能な強化学習が注目されている.本講義では,強化学習の基本概念,原理および応用方法を修得する.
| [継承] |
○概要 (必須): | □ | (英) While top-down approaches to intelligent systems design problems have exposed various limitations, bottom up approaches have been proposed and studied that allow intelligent systems to improve their own performance autonomously and incrementally during the course of interactions with the environments. This class covers those bottom-up approaches mainly focused upon the reinforcement learning algorithms. (日) 知能システムをトップダウン的に設計しようとする旧来の人工知能研究の限界が明らかとなり,外界との相互作用を通し,その性能を自律的に改善する能力を有する知能システムに関する研究が展開されている.本講義では,強化学習を中心に,そのような自律的な知能システムを設計するための方法論を解説する.
| [継承] |
○キーワード (推奨): | 1. | (英) autonomous agents (日) 自律エージェント (読) じりつえーじぇんと
| [継承] |
| 2. | (英) emergent systems design (日) 創発的設計 (読) そうはつてきせっけい
| [継承] |
| 3. | (英) reinforcement learning (日) 強化学習 (読) きょうかがくしゅう
| [継承] |
| 4. | (英) robotics (日) ロボティクス (読) ろぼてぃくす
| [継承] |
| 5. | (英) multi-agent systems (日) マルチエージェントシステム (読) まるちえーじぇんとしすてむ
| [継承] |
○先行科目 (推奨): | 1. | 知能システム ([2010/[徳島大学.工学部.知能情報工学科]/[昼間コース]]/->授業概要[2009/人工知能2])
○必要度 (任意): | □ | 0.500000
| [継承] |
| [継承] |
| 2. | 最適化理論 ([2010/[徳島大学.工学部.知能情報工学科]/[昼間コース]]/->授業概要[2009/最適化理論])
○必要度 (任意): | □ | 0.500000
| [継承] |
| [継承] |
○関連科目 (推奨): | 1. | 機械翻訳特論 ([2010/[徳島大学.先端技術科学教育部.システム創生工学専攻.知能情報システム工学コース]/[博士前期課程]]/->授業概要[2009/機械翻訳特論])
| [継承] |
| 2. | 言語モデル論 ([2010/[徳島大学.先端技術科学教育部.システム創生工学専攻.知能情報システム工学コース]/[博士前期課程]]/->授業概要[2009/言語モデル論])
| [継承] |
| 3. | 自然言語理解 ([2010/[徳島大学.先端技術科学教育部.システム創生工学専攻.知能情報システム工学コース]/[博士前期課程]]/->授業概要[2009/自然言語理解])
| [継承] |
○要件 (任意): |
○注意 (任意): |
○目標 (必須): | 1. | (英) Recently, bottom-up approaches to the intelligent systems designs problems have been proposed based on various reinforcement learning algorithms. This class aims at the understanding of the theory of the algorithms as well as their potentials and limitations through the applications to small-scale systems design problems. (日) 知能システムのボトムアップ的な設計手法の基礎となる種々の強化学習手法の原理を修得すると共に,小規模な知能システムの設計を通して,各手法の性能と限界を理解する.
| [継承] |
○計画 (必須): | 1. | (英) Introduction (日) 序論
| [継承] |
| 2. | (英) Reinforcement learning: basic concepts (1) (日) 強化学習の基本概念 (1)
| [継承] |
| 3. | (英) Reinforcement learning: basic concepts (2) (日) 強化学習の基本概念 (2)
| [継承] |
| 4. | (英) Basic reinforcement learning algorithms (1) (日) 基本的な強化学習 (1)
| [継承] |
| 5. | (英) Basic reinforcement learning algorithms (2) (日) 基本的な強化学習 (2)
| [継承] |
| 6. | (英) Basic reinforcement learning algorithms (3) (日) 基本的な強化学習 (3)
| [継承] |
| 7. | (英) Reinforcement learning considering application to real-world tasks (1) (日) 実環境への応用を考慮した強化学習 (1)
| [継承] |
| 8. | (英) Reinforcement learning considering application to real-world tasks (2) (日) 実環境への応用を考慮した強化学習 (2)
| [継承] |
| 9. | (英) Reinforcement learning based on evolution strategies (日) 進化戦略に基づく強化学習
| [継承] |
| 10. | (英) Reinforcement learning based on evolutionary computation (日) 進化計算に基づく強化学習
| [継承] |
| 11. | (英) Reinforcement learning based on genetic programming (日) 遺伝プログラミングに基づく強化学習
| [継承] |
| 12. | (英) Reinforcement learning and robotics (1) (日) 強化学習とロボティクス (1)
| [継承] |
| 13. | (英) Reinforcement learning and robotics (2) (日) 強化学習とロボティクス (2)
| [継承] |
| 14. | (英) Reinforcement learning and multi-agent systems (1) (日) 強化学習とマルチエージェントシステム (1)
| [継承] |
| 15. | (英) Reinforcement learning and multi-agent systems (2) (日) 強化学習とマルチエージェントシステム (2)
| [継承] |
○評価 (必須): | □ | (英) Attendance (30%), report (70%) (日) 出席(30%),期末レポート(70%) として評価する.
| [継承] |
○再評価 (必須): |
○対象学生 (任意): | □ | 開講コース学生のみ履修可能
| [継承] |
○教科書 (必須): | 1. | (英) To be introduced in the class. (日) 授業中に紹介する.
| [継承] |
○参考資料 (推奨): | 1. | (英) To be introduced in the class. (日) 授業中に紹介する.
| [継承] |
○URL (任意): |
○連絡先 (推奨): | 1. | 小野 典彦
| [継承] |
| 2. | 最上 義夫
| [継承] |
○科目コード (推奨): |
○備考 (任意): |