<feed xmlns="http://www.w3.org/2005/Atom"> <id>https://jayrobotics.github.io/</id><title>Real Robot</title><subtitle>A minimal, responsive and feature-rich Jekyll theme for technical writing.</subtitle> <updated>2026-06-16T12:20:56+09:00</updated> <author> <name>JaeJin Hwang</name> <uri>https://jayrobotics.github.io/</uri> </author><link rel="self" type="application/atom+xml" href="https://jayrobotics.github.io/feed.xml"/><link rel="alternate" type="text/html" hreflang="en-KR" href="https://jayrobotics.github.io/"/> <generator uri="https://jekyllrb.com/" version="4.4.1">Jekyll</generator> <rights> © 2026 JaeJin Hwang </rights> <icon>/assets/img/favicons/favicon.ico</icon> <logo>/assets/img/favicons/favicon-96x96.png</logo> <entry><title>[오승상 강화학습] 02. Markov property</title><link href="https://jayrobotics.github.io/posts/OSSRL-02/" rel="alternate" type="text/html" title="[오승상 강화학습] 02. Markov property" /><published>2026-06-16T10:24:00+09:00</published> <updated>2026-06-16T10:24:00+09:00</updated> <id>https://jayrobotics.github.io/posts/OSSRL-02/</id> <content type="text/html" src="https://jayrobotics.github.io/posts/OSSRL-02/" /> <author> <name>JaeJin Hwang</name> </author> <category term="Reinforcement Learning" /> <summary>1. Grid world example Grid world example start 지점에서 출발해서 action을 취하며 한 칸씩 이동 (2,2) 지점에는 벽이 존재하여 이동할 수 없음 (4,3) 또는 (4,2) 위치에 도달하게 되면 게임 종료 robot이 최대한 많은 reward를 획득한 채로 게임을 종료하는 것이 목표 1-1. 에이전트(Agent) 강화학습을 통해 스스로 학습하는 컴퓨터 (학습의 주체) 위 grid world example에서 agent는 robot에 해당한다. 1-2. 상태(State) $S = { (1,1),(1,2), \cdots, (4,2),(4,3) }$ 위 grid world example에서는 (2,2)를 제외한 총 11개의...</summary> </entry> <entry><title>[오승상 강화학습] 01. DRL Introduction</title><link href="https://jayrobotics.github.io/posts/OSSRL-01/" rel="alternate" type="text/html" title="[오승상 강화학습] 01. DRL Introduction" /><published>2026-06-14T10:24:00+09:00</published> <updated>2026-06-16T12:20:27+09:00</updated> <id>https://jayrobotics.github.io/posts/OSSRL-01/</id> <content type="text/html" src="https://jayrobotics.github.io/posts/OSSRL-01/" /> <author> <name>JaeJin Hwang</name> </author> <category term="Reinforcement Learning" /> <summary>1. 목차 2. Machine Learning algorithm categories 2-1. 인공지능(AI, Artificial Intelligence) 인간의 학습, 추론, 문제 해결 능력 등을 컴퓨터나 기계가 인공적으로 구현하는 기술 2-2. 기계학습(ML, Machine Learning) 컴퓨터가 사람이 직접 만든 명시적인 규칙을 일일이 프로그래밍하지 않고도, 방대한 데이터를 통해 스스로 패턴을 학습하고 예측이나 결정을 내리게하는 기술 인공지능(AI)의 하위 분야 2-3. 지도학습(Supervised Learning) label이 지정된 training dataset을 통해 학습한다. 회귀(regression) 또는 분류(classification)를 위한...</summary> </entry> <entry><title>[Github Pages] 깃허브 블로그 만들기 (2) - 초기 세팅</title><link href="https://jayrobotics.github.io/posts/github-pages-02/" rel="alternate" type="text/html" title="[Github Pages] 깃허브 블로그 만들기 (2) - 초기 세팅" /><published>2026-02-23T16:48:00+09:00</published> <updated>2026-02-23T16:48:00+09:00</updated> <id>https://jayrobotics.github.io/posts/github-pages-02/</id> <content type="text/html" src="https://jayrobotics.github.io/posts/github-pages-02/" /> <author> <name>JaeJin Hwang</name> </author> <category term="Github Pages" /> <summary>1. 배경지식 1-1. Ruby 란? 1995년 일본의 마츠모토 유키히로(Yukihiro Mastumoto)가 만든 객체지향 프로그래밍 언어이다. 간결함과 생산성을 강조한 만큼 사람에게 매우 친숙한 언어를 지향하기 때문에 원하는 부분을 자유롭게 바꿀 수 있는 유연성과 함께 Block이나 Mixin과 같이 다른 언어가 가지고 있지 않은 다양한 매력을 보유하고 있다. 순수 객체지향 순수 객체지향 언어는 모든 것이 객체이며, 모든 연산이 객체 간의 메시지 전달로 이루어지는 언어이다. 예들 들어 Java의 경우에는 char, int와 같은 원시 자료형(primitive type)이 존재하며, 이를 객체로 다루기 위해 Integer, Character 등의 Wrapper Class가...</summary> </entry> <entry><title>[Github Pages] 깃허브 블로그 만들기 (1) - Github Pages를 시작하는 이유</title><link href="https://jayrobotics.github.io/posts/github-pages-01/" rel="alternate" type="text/html" title="[Github Pages] 깃허브 블로그 만들기 (1) - Github Pages를 시작하는 이유" /><published>2026-02-23T16:48:00+09:00</published> <updated>2026-02-23T16:48:00+09:00</updated> <id>https://jayrobotics.github.io/posts/github-pages-01/</id> <content type="text/html" src="https://jayrobotics.github.io/posts/github-pages-01/" /> <author> <name>JaeJin Hwang</name> </author> <category term="Github Pages" /> <summary>1. Github Pages를 시작하게 된 이유 원래는 Notion을 사용하였었는데 2026-1학기부터 석사 과정을 진학하게 되면서 제대로 된 포트폴리오를 만들고 싶은 욕심이 생겼다. 4학년 막학기에(2025-2) Github Pages를 개설하였으나 작성 과정에서 어려움을 겪어서 잠깐 Tistory로 넘어갔었다. 하지만 Tistory는 마크다운이 참 불편한 부분이 있어서 결국은 원래 사용하던 Github Pages를 사용하기로 마음 먹었다. 2. Github Pages란? Github 저장소(Repository)에 올린 정적 웹 파일(HTML, CSS, JS)을 무료로 인터넷에 배포해주는 서비스이다. 조금 더 자세히 이야기 하자면 GitHub Pages는 Github에서 제공하는 정적 웹 호스팅 ...</summary> </entry> <entry><title>[파이썬 알고리즘] Ch 7-1. 피보나치 수열과 동적 계획법</title><link href="https://jayrobotics.github.io/posts/algo-ch7-1/" rel="alternate" type="text/html" title="[파이썬 알고리즘] Ch 7-1. 피보나치 수열과 동적 계획법" /><published>2025-12-16T00:18:00+09:00</published> <updated>2025-12-16T00:18:00+09:00</updated> <id>https://jayrobotics.github.io/posts/algo-ch7-1/</id> <content type="text/html" src="https://jayrobotics.github.io/posts/algo-ch7-1/" /> <author> <name>JaeJin Hwang</name> </author> <category term="algorithm" /> <summary>참고 도서: 최영규, ⌜파이썬 알고리즘⌟ 생능츨판, 2021 동적 계획법(Dynamic programming)은 1950년대 미국 수학자 벨맨(Richard Bellman)이 만든 용어로, 다단계 의사 결정 프로세스를 최적화하는 일반적인 방법으로 처음 소개되었다. 큰 문제를 작은 문제로 나누고, 그 결과를 저장해 두었다가 재사용하는 문제 해결 기법이다. 여기서 핵심은 같은 부분 문제를 다시 풀지 않도록 하는 것이다. 따라서, 넓게 보면 공간으로 시간 벌기 전략에 포함 될 수도 있다. 피보나치 수열(Fibonacci numbers)은 다음과 같이 순환적으로 정의된다. (분할 정복) [fibo(n) =\begin{cases}n &amp;amp; n \leq 1\fibo(n-2) \ + \ fib...</summary> </entry> </feed>
