Q-Learning부터 DQN, PPO까지, 강화학습의 핵심 이론과 실전 알고리즘을 직접 구현하고 최적화하는 집중형 워크숍 과정입니다. 기초 수학 개념부터 실전 프로젝트(Stable-Baselines3, Optuna 기반 튜닝, 금융 데이터 활용)까지, 단 3일 만에 강화학습 실무 역량을 완성합니다.
✅ [Standard] 핵심
이론 및 DQN 실습 (1일차, 8시간)
○ MDP(마르코프 결정 과정), 벨만
방정식 등 핵심 개념 체계적 정리
○ Q-Learning & DQN 원리 이해 및 구조 분석
○ Python으로 DQN 모델
구현 실습
○ CartPole 문제 해결 프로젝트 수행
✅ [Deluxe] 정책
기반 알고리즘과 PPO 실전 (2일차, 8시간)
○ Policy Gradient 기초(REINFORCE, A2C, PPO) 이론과 수식 기반 이해
○ 신경망 구조 최적화 및 성능 향상 전략 학습
○ PPO 알고리즘 기반
CartPole 실습 및 파라미터 조정
✅ [Premium] 실전
프로젝트 & 전문가 과정 (3일차, 8시간)
○ Optuna 기반 하이퍼파라미터 최적화(베이지안 접근)
○ 실습: 인공지능 자산배분전략, 인력배치 스케줄링
🎯 수강
대상
○ 강화학습의 전반적 흐름부터 실전 적용까지 마스터하고자 하는 AI 학습자
○ 금융/로보어드바이저/트레이딩 분야에 AI 접목을 시도 중인 전문가
○ 강화학습 기반 모델을 개발하고 싶은 데이터사이언티스트 및 엔지니어