AI/Reinforcement Learning (1) 썸네일형 리스트형 강화학습 개요 강화학습이란 사람이 어떤 행동에 보상을 받으면, 그 보상을 받는 행동이 더욱 강화되는 원리를 이용해 인공지능 학습에 적용한 방법이다. 학습 과정을 생각해보면 어떤 행동을 하고 보상을 받는 과정을 반복하는 것인데 즉, 순차적으로 행동을 결정하는 문제라고 볼 수 있다. 좀 더, 명확한 표현으로 말해보자면, 어떤 에이전트(Agent)가 연속되는 상황(State, s)에서 그에 맞는 행동(Action, a)을 취하면 보상(Return, R)을 받는 과정이다. 그리고 agent가 취할 수 있는 action의 종류나 state, 각 state에서 어떤 action을 취했을 때의 return은 모두 환경(Environment)에 포함된다. 이러한 표현들을 이용해서 컴퓨터가 학습 과정을 이해할 수 있도록 수학적으로 수.. 이전 1 다음