컴공돌이의 스터디 블로그

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (50)

컴공돌이의 스터디 블로그

Machine Learning 관련 TED 동영상 정리

* 정기적으로 업데이트 할 예정입니다. [TED 동영상] [2014.12] Speaker : Jeremy Howard / Title : The wonderful and terrifying implications of computers that can learn- Tags : AI, Algorithm, Computers, Health, Intelligence, Machine Learning, Technologyhttps://www.ted.com/talks/jeremy_howard_the_wonderful_and_terrifying_implications_of_computers_that_can_learn [2015.03] Speaker : Fei-Fei Li / Title : How we're teachin..

공지 2018. 3. 9. 16:35

행렬(Matrix, Array)에 열(Column) 추가하기

행렬(Matrix, Array)에 열(Column) 추가하기 파이썬 버전 : Python 3.6.2사용 에디터 : PyCharm 행렬에 열을 추가하는 방법은 정확하게는 추가하고자 하는 열의 개수를 적용한 새로운 행렬을 만든 뒤 데이터를 넣는 방법이라고 설명할 수 있습니다. 이번 글에서는 리스트 형태의 행을 행렬에 추가하는 방법이지만 만약 array의 형태의 행이라면 append 함수를 사용하여 추가해주면 됩니다. 123456789import numpy as np original_data = np.array([[1,2,3],[5,6,7]]) new_column = [4,8] new_data = np.zeros((original_data.shape[0],original_data.shape[1]+1))new_..

Code Solution/Python 2018. 3. 9. 16:21

[시즌RL].Lecture 4 - Q-Learning exploit&exploration and discounted reward

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Q-Learning Algorithm Reinforcement Learning(강화 학습)에서 Agent가 Action을 결정하는 것을 도와주는 함수를 Q-Function이라고 하고 Q-Function의 출력값을 사용해서 Action을 결정하는 것을 Q-Learning이라고 합니다. Q-Learning의 알고리즘을 수식으로 표현하면 아래와 같습니다. 하지만 위의 수식을 그대로 사용해서 학습을 하게될 경우, 한번 목표에 도달하게된 경로로만 움직이고 새로운 길을 학습하지 않는다는 문제점이 발생하게 됩니다. 이러한 문제점을 해결하기 위해서는 몇 가지 방법을 사용할 수 있습니다. 그..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 9. 13:34

[시즌RL].Lecture 3 - Dummy Q-Learning

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Q-Learning Reinforcement Learning(강화 학습)에서 Agent는 현재 State에서 Action을 취하기 전까지 다른 State에 대한 정보를 알지 못합니다 또한 Goal에 도달하기 전까지는 Reward가 0이기 때문에 Action이 좋은지 나쁜지 알 수 없습니다. 따라서 어떠한 Action을 취할지 결정하는 것은 매우 중요하다고 할 수 있습니다. 이러한 상황에서 Agent가 Action을 결정하는 것을 도와주는 함수를 Q-Function이라고 하고 다른말로는 State-Action Value Function이라고도 합니다. 이 함수는 현재의 Stat..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 8. 12:00

[시즌RL].Lecture 2 - OpenAI GYM 게임해보기

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. OpenAI GYM Reinforcement Learning(강화 학습)은 Agent와 Environment(환경)로 구성되어 있습니다. Agent가 어떠한 Action(행동)을 하게 되면 그것에 따른 Environment에서의 State(상태)와 Reward(보상)에 대한 정보를 받게 되고 이것을 통하여 학습을 하는 것이 Reinforcement Learning인데, 여기서 Environment를 전부 구현하는 것은 매우 어렵습니다. 이런 구현하기 어려운 Environment가 미리 구현되어져 있고 이것을 라이브러리를 통해 쉽게 사용할 수 있게 제공하는 것이 OpenAI G..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 7. 12:00

Prev 1 2 3 4 5 6 7 8 ··· 10 Next

목록전체 글 (50)

컴공돌이의 스터디 블로그

티스토리툴바