[오승상 강화학습] 02. Markov property
1. Grid world example Grid world example start 지점에서 출발해서 action을 취하며 한 칸씩 이동 (2,2) 지점에는 벽이 존재하여 이동할 수 없음 (4,3) 또는 (4,2) 위치에 도달하게 되면 게임 종료 robot이 최대한 많은 reward를 획득한 채로 게임을 종료하는 것이 목표 1-...
1. Grid world example Grid world example start 지점에서 출발해서 action을 취하며 한 칸씩 이동 (2,2) 지점에는 벽이 존재하여 이동할 수 없음 (4,3) 또는 (4,2) 위치에 도달하게 되면 게임 종료 robot이 최대한 많은 reward를 획득한 채로 게임을 종료하는 것이 목표 1-...
1. 목차 2. Machine Learning algorithm categories 2-1. 인공지능(AI, Artificial Intelligence) 인간의 학습, 추론, 문제 해결 능력 등을 컴퓨터나 기계가 인공적으로 구현하는 기술 2-2. 기계학습(ML, Machine Learning) 컴퓨터가 사람이 직접 만든 명시적...

1. 배경지식 1-1. Ruby 란? 1995년 일본의 마츠모토 유키히로(Yukihiro Mastumoto)가 만든 객체지향 프로그래밍 언어이다. 간결함과 생산성을 강조한 만큼 사람에게 매우 친숙한 언어를 지향하기 때문에 원하는 부분을 자유롭게 바꿀 수 있는 유연성과 함께 Block이나 Mixin과 같이 다른 언어가 가지고 있지 않은 다양한 매...

1. Github Pages를 시작하게 된 이유 원래는 Notion을 사용하였었는데 2026-1학기부터 석사 과정을 진학하게 되면서 제대로 된 포트폴리오를 만들고 싶은 욕심이 생겼다. 4학년 막학기에(2025-2) Github Pages를 개설하였으나 작성 과정에서 어려움을 겪어서 잠깐 Tistory로 넘어갔었다. 하지만 Tistory는 마크다운이 참...
참고 도서: 최영규, ⌜파이썬 알고리즘⌟ 생능츨판, 2021 동적 계획법(Dynamic programming)은 1950년대 미국 수학자 벨맨(Richard Bellman)이 만든 용어로, 다단계 의사 결정 프로세스를 최적화하는 일반적인 방법으로 처음 소개되었다. 큰 문제를 작은 문제로 나누고, 그 결과를 저장해 두었다가 재사용하는 문제 해결 ...