반응형
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 딥 러닝
- data
- Deep learning
- 강화학습
- Neural network
- Kaggle
- iris
- machine learning
- Sigmoid Function
- 논리 회귀
- csv
- 합성곱 신경망
- 기울기 감소 알고리즘
- sklearn
- cost function
- Logistic regression
- 비용 함수
- 회귀
- Gradient descent algorithm
- Logistic
- reinforcement learning
- 정리
- RL
- 시그모이드 함수
- Q-Learning
- 요약
- 선형 회귀
- CNN
- regression
- convolutional neural network
Archives
- Today
- Total
목록Google (1)
컴공돌이의 스터디 블로그
[시즌RL].Lecture 7 - DQN
* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. DQN 대부분의 Reinforcement Learning을 적용시키는 부분은 카메라를 통해 입력받은 화면을 사용하기 때문에 Q-Table로는 표현하기가 매우 어렵습니다. 이러한 이유 때문에 Q-Table을 대체할 것을 선택하였고 대안인 Neural Network를 사용한 방법을 Q-Network라고 합니다. Q-Network의 알고리즘은 매우 훌륭하지만 실질적으로 실행시켜보면 잘 돌아가지 않습니다. 그 이유는 2가지 요인 때문인데 첫번째 요인은 Sample Data들 간의 연관성을 고려해야 한다는 점이고 두번째 요인은 예측한 값을 비교해야하는 값이 안정되어 있지 않다는 점 입..
강의 Study/모두를 위한 머신러닝과 딥러닝 강의
2018. 3. 14. 18:29