[오승상 강화학습] 03. Markov Decision Process

1. Markov Decision Process (MDP) 1-1. Markov process $\lbrace S_t \rbrace$ : Markov property를 만족하는 Stochastic process (collection of random variables, $S_0, \ S_1, \ \dots \ , \ S_{t-1}, \ S_...

Jun 23, 2026 Reinforcement Learning

[오승상 강화학습] 02. Markov property

1. Grid world example Grid world example start 지점에서 출발해서 action을 취하며 한 칸씩 이동 (2,2) 지점에는 벽이 존재하여 이동할 수 없음 (4,3) 또는 (4,2) 위치에 도달하게 되면 게임 종료 robot이 최대한 많은 reward를 획득한 채로 게임을 종료하는 것이 목표 1-...

Jun 16, 2026 Reinforcement Learning

[오승상 강화학습] 01. DRL Introduction

1. 목차 2. Machine Learning algorithm categories 2-1. 인공지능(AI, Artificial Intelligence) 인간의 학습, 추론, 문제 해결 능력 등을 컴퓨터나 기계가 인공적으로 구현하는 기술 2-2. 기계학습(ML, Machine Learning) 컴퓨터가 사람이 직접 만든 명시적...

Jun 14, 2026 Reinforcement Learning

[Github Pages] 깃허브 블로그 만들기 (2) - 초기 세팅

1. 배경지식 1-1. Ruby 란? 1995년 일본의 마츠모토 유키히로(Yukihiro Mastumoto)가 만든 객체지향 프로그래밍 언어이다. 간결함과 생산성을 강조한 만큼 사람에게 매우 친숙한 언어를 지향하기 때문에 원하는 부분을 자유롭게 바꿀 수 있는 유연성과 함께 Block이나 Mixin과 같이 다른 언어가 가지고 있지 않은 다양한 매...

Feb 23, 2026 Github Pages

[Github Pages] 깃허브 블로그 만들기 (1) - Github Pages를 시작하는 이유

1. Github Pages를 시작하게 된 이유 원래는 Notion을 사용하였었는데 2026-1학기부터 석사 과정을 진학하게 되면서 제대로 된 포트폴리오를 만들고 싶은 욕심이 생겼다. 4학년 막학기에(2025-2) Github Pages를 개설하였으나 작성 과정에서 어려움을 겪어서 잠깐 Tistory로 넘어갔었다. 하지만 Tistory는 마크다운이 참...