강의 커리큘럼 : 강화학습

 

Q-Learning부터 DQN, PPO까지, 강화학습의 핵심 이론과 실전 알고리즘을 직접 구현하고 최적화하는 집중형 워크숍 과정입니다. 기초 수학 개념부터 실전 프로젝트(Stable-Baselines3, Optuna 기반 튜닝, 금융 데이터 활용)까지, 3일 만에 강화학습 실무 역량을 완성합니다.

강의문의 : multicore.it@gmail.com 


[Standard] 핵심 이론 및 DQN 실습 (1일차, 8시간)

○ MDP(마르코프 결정 과정), 벨만 방정식 등 핵심 개념 체계적 정리

○ Q-Learning & DQN 원리 이해 및 구조 분석

○ Python으로 DQN 모델 구현 실습

○ CartPole 문제 해결 프로젝트 수행

 

[Deluxe] 정책 기반 알고리즘과 PPO 실전 (2일차, 8시간)

○ Policy Gradient 기초(REINFORCE, A2C, PPO) 이론과 수식 기반 이해

신경망 구조 최적화 및 성능 향상 전략 학습

○ PPO 알고리즘 기반 CartPole 실습 및 파라미터 조정

 

[Premium] 실전 프로젝트 & 전문가 과정 (3일차, 8시간)

○ Optuna 기반 하이퍼파라미터 최적화(베이지안 접근)

실습: 인공지능 자산배분전략, 인력배치 스케줄링

 

🎯 수강 대상

강화학습의 전반적 흐름부터 실전 적용까지 마스터하고자 하는 AI 학습자

금융/로보어드바이저/트레이딩 분야에 AI 접목을 시도 중인 전문가

강화학습 기반 모델을 개발하고 싶은 데이터사이언티스트 및 엔지니어

댓글 쓰기

Please Select Embedded Mode To Show The Comment System.*

다음 이전