[시즌RL].Lecture 1 - 수업의 개요

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

컴공돌이의 스터디 블로그

[시즌RL].Lecture 1 - 수업의 개요 본문

강의 Study/모두를 위한 머신러닝과 딥러닝 강의

[시즌RL].Lecture 1 - 수업의 개요

제갈초아 2018. 3. 6. 12:00

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다.

Reinforcement Learning(RL, 강화 학습)

Reinforcement Learning(강화 학습)은 Deep Learning(딥 러닝)과 함께 최근 많은 주목을 받는 분야입니다.

우리는 과거의 경험으로부터 학습을 할 수 있습니다. 자라왔던 수년동안 경험했었던 칭찬과 꾸중을 통해 지금의 우리가 형성되었다고 할 수 있을것입니다. 이런 인간이 학습하는 과정을 Machine Learning(기계 학습)에 적용해볼수 없을까 해서 만들어진것이 바로 이 Reinforcement Learning 입니다.

Reinforcement Learning은 Agent와 Environment(환경)로 구성되어 있습니다. Actor가 어떠한 Action(행동)을 하면 Environment속 에서의 State(상태)가 달라지게 됩니다. Agent는 Action을 반복하다가 특정 State가 되면 Reward(보상)을 받게됩니다. 이러한 형태의 모델을 학습할 수 있는 것이 Reinforcement Learning 입니다.

Reinforcement Learning이 나온지는 오래되었지만 그렇게 큰 이슈를 받지 못하고 있었습니다. 하지만 2013년 Atari의 벽돌깨기(Breakout) 게임에 Reinforcement Learning을 적용시켜본 결과 훌륭하게 스스로 게임을 하는 프로그램이 만들어지게 되면서 많은 주목을 받게 되었습니다.

벽돌깨기 말고도 다양한 게임에 Reinforcement Learning을 적용시켜본 결과 적지않은 게임에서 인간보다 좋은 점수를 내는 것이 가능하다는 결과가 나왔습니다.

Reinforcement Learning 응용 분야

Reinforcement Learning은 게임 분야를 제외하더라도 많은 분야에서 응용이 가능합니다.

- AlphaGo

- 데이터센터의 냉각비용 절감

- 로봇의 관절 회전력 학습

- 재고, 부품의 관리 및 자원 할당

- 투자 결정

이 밖에도 많은 분야에서 Reinforcement Learning을 사용할 수 있습니다.

* Summary *

1. 칭찬과 꾸중을 통해 학습하는 인간의 학습 과정을 Machine Learning(기계 학습)에 적용시킨 것이 Reinforcement Learning(강화 학습)이다.

2. Reinforcement Learning은 Agent와 Environment(환경)로 구성되어 있다.

3. Actor가 어떠한 Action(행동)을 하면 Environment속 에서의 State(상태)가 달라지게 되고 Action을 반복하다가 특정 State가 되면 Reward(보상)을 받게되는데 이러한 형태의 모델을 학습할 수 있는 것이 Reinforcement Learning 이다.

저작자표시 비영리 변경금지

'강의 Study > 모두를 위한 머신러닝과 딥러닝 강의' 카테고리의 다른 글

[시즌RL].Lecture 3 - Dummy Q-Learning (0)	2018.03.08
[시즌RL].Lecture 2 - OpenAI GYM 게임해보기 (0)	2018.03.07
[시즌1].Lecture 12 - Recurrent Neural Network_NN의 꽃 RNN 이야기 (0)	2018.03.05
[시즌1].Lecture 11_3 - Convolutional Neural Networks_ConvNet의 활용예 (0)	2018.03.02
[시즌1].Lecture 11_2 - Convolutional Neural Networks_ConvNet Max pooling 과 Full Network (0)	2018.02.28

'강의 Study/모두를 위한 머신러닝과 딥러닝 강의' Related Articles

Comments

컴공돌이의 스터디 블로그

[시즌RL].Lecture 1 - 수업의 개요 본문

[시즌RL].Lecture 1 - 수업의 개요

'강의 Study > 모두를 위한 머신러닝과 딥러닝 강의' 카테고리의 다른 글

티스토리툴바