반응형
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 회귀
- 정리
- CNN
- sklearn
- data
- Deep learning
- 시그모이드 함수
- 비용 함수
- csv
- reinforcement learning
- regression
- Logistic regression
- Sigmoid Function
- 요약
- 강화학습
- 논리 회귀
- convolutional neural network
- RL
- 선형 회귀
- Neural network
- Logistic
- machine learning
- cost function
- iris
- Q-Learning
- Gradient descent algorithm
- 기울기 감소 알고리즘
- 딥 러닝
- 합성곱 신경망
- Kaggle
Archives
- Today
- Total
목록Non-deterministic (1)
컴공돌이의 스터디 블로그
[시즌RL].Lecture 5 - Q-Learning in non-deterministic world
* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Q-Learning in non-deterministic world Environment(환경)는 Stochastic(확률론적인)한 성질을 가지고 있다고 할 수 있습니다. 따라서 Deterministic한 모델에서처럼 모델의 출력이 매개변수 값과 초기 조건에 의해 완전히 결정되는 것이 아니라 특유의 무작위성이 있기 때문에, 동일한 설정의 매개변수 값과 초기 조건이어도 다른 출력이 발생될 수 있습니다. 따라서 을 그대로 사용하게 되면 실제로는 학습이 잘 되지 않을 수 있습니다. 예를 들어, 목표에 도달한 학습 단계에서 A1라는 Action을 선택하였지만 환경의 무작위성 때문에 ..
강의 Study/모두를 위한 머신러닝과 딥러닝 강의
2018. 3. 12. 12:00