'분류 전체보기' 카테고리의 글 목록 (3 Page)

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (50)

컴공돌이의 스터디 블로그

Machine Learning 관련 TED 동영상 정리

* 정기적으로 업데이트 할 예정입니다. [TED 동영상] [2014.12] Speaker : Jeremy Howard / Title : The wonderful and terrifying implications of computers that can learn- Tags : AI, Algorithm, Computers, Health, Intelligence, Machine Learning, Technologyhttps://www.ted.com/talks/jeremy_howard_the_wonderful_and_terrifying_implications_of_computers_that_can_learn [2015.03] Speaker : Fei-Fei Li / Title : How we're teachin..

공지 2018. 3. 9. 16:35

행렬(Matrix, Array)에 열(Column) 추가하기

행렬(Matrix, Array)에 열(Column) 추가하기 파이썬 버전 : Python 3.6.2사용 에디터 : PyCharm 행렬에 열을 추가하는 방법은 정확하게는 추가하고자 하는 열의 개수를 적용한 새로운 행렬을 만든 뒤 데이터를 넣는 방법이라고 설명할 수 있습니다. 이번 글에서는 리스트 형태의 행을 행렬에 추가하는 방법이지만 만약 array의 형태의 행이라면 append 함수를 사용하여 추가해주면 됩니다. 123456789import numpy as np original_data = np.array([[1,2,3],[5,6,7]]) new_column = [4,8] new_data = np.zeros((original_data.shape[0],original_data.shape[1]+1))new_..

Code Solution/Python 2018. 3. 9. 16:21

[시즌RL].Lecture 4 - Q-Learning exploit&exploration and discounted reward

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Q-Learning Algorithm Reinforcement Learning(강화 학습)에서 Agent가 Action을 결정하는 것을 도와주는 함수를 Q-Function이라고 하고 Q-Function의 출력값을 사용해서 Action을 결정하는 것을 Q-Learning이라고 합니다. Q-Learning의 알고리즘을 수식으로 표현하면 아래와 같습니다. 하지만 위의 수식을 그대로 사용해서 학습을 하게될 경우, 한번 목표에 도달하게된 경로로만 움직이고 새로운 길을 학습하지 않는다는 문제점이 발생하게 됩니다. 이러한 문제점을 해결하기 위해서는 몇 가지 방법을 사용할 수 있습니다. 그..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 9. 13:34

[시즌RL].Lecture 3 - Dummy Q-Learning

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Q-Learning Reinforcement Learning(강화 학습)에서 Agent는 현재 State에서 Action을 취하기 전까지 다른 State에 대한 정보를 알지 못합니다 또한 Goal에 도달하기 전까지는 Reward가 0이기 때문에 Action이 좋은지 나쁜지 알 수 없습니다. 따라서 어떠한 Action을 취할지 결정하는 것은 매우 중요하다고 할 수 있습니다. 이러한 상황에서 Agent가 Action을 결정하는 것을 도와주는 함수를 Q-Function이라고 하고 다른말로는 State-Action Value Function이라고도 합니다. 이 함수는 현재의 Stat..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 8. 12:00

[시즌RL].Lecture 2 - OpenAI GYM 게임해보기

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. OpenAI GYM Reinforcement Learning(강화 학습)은 Agent와 Environment(환경)로 구성되어 있습니다. Agent가 어떠한 Action(행동)을 하게 되면 그것에 따른 Environment에서의 State(상태)와 Reward(보상)에 대한 정보를 받게 되고 이것을 통하여 학습을 하는 것이 Reinforcement Learning인데, 여기서 Environment를 전부 구현하는 것은 매우 어렵습니다. 이런 구현하기 어려운 Environment가 미리 구현되어져 있고 이것을 라이브러리를 통해 쉽게 사용할 수 있게 제공하는 것이 OpenAI G..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 7. 12:00

[시즌RL].Lecture 1 - 수업의 개요

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Reinforcement Learning(RL, 강화 학습) Reinforcement Learning(강화 학습)은 Deep Learning(딥 러닝)과 함께 최근 많은 주목을 받는 분야입니다. 우리는 과거의 경험으로부터 학습을 할 수 있습니다. 자라왔던 수년동안 경험했었던 칭찬과 꾸중을 통해 지금의 우리가 형성되었다고 할 수 있을것입니다. 이런 인간이 학습하는 과정을 Machine Learning(기계 학습)에 적용해볼수 없을까 해서 만들어진것이 바로 이 Reinforcement Learning 입니다. Reinforcement Learning은 Agent와 Environm..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 6. 12:00

[시즌1].Lecture 12 - Recurrent Neural Network_NN의 꽃 RNN 이야기

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Recurrent Neural Network(RNN) 우리가 사용하는 데이터에는 Sequence Data(순차적 데이터)가 굉장히 많습니다. Sequence Data란 하나의 데이터가 아니라 음성, 문장과 같은 연속적인 데이터를 의미합니다. 기본적인 Neural Network나 Convolutional Neural Network 같은 경우에는 1개의 입력이 1개의 출력으로 반환되는 형태이기 때문에 Sequence Data 같은 Series Data를 적용하기에는 어려움이 있습니다. 이전 State의 값이 현재 State의 값에 영향을 끼치는 Sequence Data를 사용하기..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 5. 12:00

[시즌1].Lecture 11_3 - Convolutional Neural Networks_ConvNet의 활용예

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. LeNet-5 LeCun 교수님은 1990년에 LeNet-1을 발표하였고 이것을 조금씩 보완해서 1998년에 LeNet-5를 만들어 내었습니다. LeNet-5에서는 입력데이터의 크기를 32 x 32로 만들었고 Convolution Layer에서 사용되는 Filter의 크기를 5 x 5로 Stride는 1으로, Pooling Layer에서 사용되는 Filter의 크기를 2 x 2로 Stride는 2로 설정하였습니다. AlexNet Alex는 2012년에 AlexNet을 논문으로 발표하였습니다. AlexNet은 2개의 병렬구조인 점을 제외하면 LeNet-5와 크게 다르지는 않습니..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 3. 2. 12:00

tf.placeholder

* 이 글은 www.tensorflow.org에서 볼 수 있는 내용을 정리한 글 입니다. tf.placeholder[변수]- dtype : tensor에 넣을 값의 타입- shape : tensor에 넣을 값의 치수- name : 함수의 이름 [용도]- tf.placeholder는 입력한 변수값들을 기반으로 나중에 값을 입력할 수 있는 변수 tensor를 생성하는 문법입니다. [주의할 점]- shape를 정의하지 않은 경우에는 어떠한 모양의 값도 넣을 수 있습니다. [중요한 것]- 이 tensor는 값을 넣지 않은채로 실행시키면 에러가 발생합니다. 따라서 선언해 준 후에 Session.run(), Tensor.eval(), Operation.run()의 변수인 feed_dict를 사용하여 값을 반드시 넣..

Python 주요 함수/Tensorflow 2018. 2. 28. 14:00

[시즌1].Lecture 11_2 - Convolutional Neural Networks_ConvNet Max pooling 과 Full Network

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다. Pooling Layer Pooling Layer에서 Pooling은 다른 말로 Sampling이라고 부를 수도 있습니다. Layer의 이름에서 알 수 있듯이 Pooling Layer에서는 여러 Depth를 가지고 있는 Feature Map의 각각의 Depth마다 Resize(Sampling)을 해준 뒤 다시 합쳐주는 작업을 하게 됩니다. Pooling Layer에서도 Convolution Layer처럼 Filter를 사용합니다. Filter의 크기와 Stride를 정해주면 그것을 사용해서 Sampling을 해주게 되는데 여기서 주로 사용되는 방법이 바로 Max Pooling..

강의 Study/모두를 위한 머신러닝과 딥러닝 강의 2018. 2. 28. 12:00

Prev 1 2 3 4 5 Next

목록분류 전체보기 (50)

컴공돌이의 스터디 블로그

티스토리툴바