AI
-
[GCP] snapshot disk 를 다른 프로젝트로 옮기는 법AI/Cloud 2020. 3. 5. 17:05
여러번 찾아보는 것은 정리해두려고 한다. :) 가. snapshot 을 뜬 디스크를 다른 프로젝트로 옮기는 법 1) 복사하고자 하는 디스크의 snapshot 을 ui 에서 만든다. 2) 해당 스냅샷의 uri 를 찾기 위해서 해당 명령어를 콘솔에 친다. gcloud compute snapshots list --uri 뭐 이런 식으로 생겼다. https://www.googleapis.com/compute/v1/projects/projectname/global/snapshots/snapshot-1 3) 옮기고자 하는 다른 프로젝트로 설정한다. --source-snapshot https://www.googleapis.com/compute/v1/projects/projectname/global/snapshots/..
-
Colab 에서 구글 드라이브를 사용해보자AI/Collab 2020. 2. 1. 18:34
안녕 친구들! 오늘은 콜랩을 사용해서 구글 드라이브를 연동해보려고 해. 준비 되었니? 딥러닝의 세계로 떠나자~~ 1. 콜랩들어가기 https://colab.research.google.com/ 위에 링크로 들어갓! 2. 새 노트 만들기 하단에 있는 내 PYTHON 3 노트 옆쪽에 화살표를 눌러! 거기서 python 3 와 2 중에서 원하는 노트를 선택해. 난 3를 선택했어 Very Very Clean 한 노트가 나와. 여기에 우리들의 아름다운 코딩을 할 노트야. 여기서 제일 위에 untitle0.ipynb 이 제목인데 이걸 너희 맘대루 바꿔줘 그리고 여러가지 ui 를 살펴봐. 기본적으로 동작은 jupyter notebook 과 비슷해 Cntrl + m + h 를 누르면 키보드 단축키 항목이 나와! 우리가..
-
Edge computing & Cloud computingAI/Edge Computing 2019. 7. 4. 00:21
[엣지 컴퓨팅과 클라우드 컴퓨팅] 중앙컴퓨팅 : 중앙 컴퓨터를 필요로하며, 여러 대의 다른 컴퓨터가 터미널을 통해이 컴퓨터에 액세스 할 수 있습니다. 분산컴퓨팅 : 여러 독립형 컴퓨터 또는 기계를 포함하며 다양한 프로토콜을 통해 서로 통신합니다. 클라우드 컴퓨팅 : 중앙 컴퓨팅의 형식을 지닌다. 사용자가 어디에 있던, 클라우드 서버에 접속해서 처리해야한다. 이는 각 개별기기에서 처리하는 것보다 시간이 오래걸린다. 엣지 컴퓨팅의 등장 : 클라우드 컴퓨팅에서는 다음과 같은 문제가 존재한다. 1) 보안의 문제 : 개인정보를 우선 중앙 컴퓨팅으로 보내는 과정에서 해킹의 가능성이 있으며, 실제 icloud 가 해킹되는 사건이 존재했다. 2) 트래픽, 데이터 전송의 비용 문제 : 로컬의 데이터를 클라우드로 보내는 ..
-
[4] DP, MC, TD(0)AI/강화학습 2019. 5. 7. 23:25
Reinforcement Learning : An Introduction - [4] DP, MC, TD(0) Chapter 4. DP, MC, TD(0) Planning & Learning planning 앞서 배운 environment에 대한 model 을 가지고 있는 경우, Markov Decision Process 에 대한 full knowlege 를 가지고 있게 된다. 이를 planning 이라고 하며 MDP 의 정보를 기반한다. learning Learning이란 environment의 model을 모르지만 상호작용을 통해서 문제를 푸는 것을 말합니다. 이중 planning 의 process 는 prediction 과 control 로 이루어진다. Prediction 에서는 value funct..
-
[3] Finite Markov Decision ProcessAI/강화학습 2019. 5. 7. 23:09
Reinforcement Learning : An Introduction - [3] Finite Markov Decision Process Chapter 3. Finite Markov Decision Process Markov Process 마르코브 프로세스란, 시간 연속적인 state series 들이 과거의 state 의 영향을 받는 조건부 확률로 정의됨을 의미합니다. Markov Reward Process 마르코브 프로세스에 reward 의 개념(과 감가상각)을 추가한 것이 마르코브 reward process 입니다. Return : total discount reward 전체 reward를 시간에 따른 감가상각을 포함하여 합산 한 것이 return 입니다. value function : expec..
-
[2] Multi-arm BanditsAI/강화학습 2019. 4. 13. 00:42
Reinforcement Learning : An Introduction - [2] Multi-arm BanditsChapter 2. Multi Arm Bandits Multi Arm Bandits Problem 먼저 강화학습에 대한 전체적인 통찰을 얻기 위한 1 state problem 인 multi arm bandits problem 부터 시작해보자. 카지노에 승률이 다른 슬롯머신(bandits)들이 있고 이들중 돈을 걸고 레버(arm)을 내려야한다면? 또한 이 슬롯머신들의 승률이 시간에 따라서 변화한다면? 어떻게 하는 것이 가장 많은 돈(rewards)을 얻는 방법인가? Evaluation feedback 강화학습을 다른 알고리즘들과 구분하는 가장 큰 차이점 중 하나는, 학습 정보를 사용하여 act..
-
[1] IntroductionAI/강화학습 2019. 4. 13. 00:40
Reinforcement Learning : An Introduction - [1] IntroductionChapter 1. Introduction to RL Reward Hypothesis 강화학습은 Reward Hypothesis에 기초합니다. Reward Hypothesis All goals can be descridbed by the maximization of expected cumulative reward 우리의 목표는 최상의 보상을 결과로 하는 행동들을 하는 것입니다. 하지만 단기적인 최상의 보상 행동이 장기적인 관점에서 총 보상의 합이 최대인 행동은 아닐 수 있습니다. Agent, Environment, Observation, Reward 행동을 하는 주최를 Agent 라고 하며, 이는 어..