강화학습 워크샵

참가 등록

일 시 : 2018년 7월 10일 (화) 10:00 ~ 18:00
장 소 : COEX, 3층 세미나룸
등 록 비 : (중식 포함) 사전 등록 12만원 / 현장 등록 15만원

“컴퓨터가 실험을 통해 프로그래머가 가르칠 수 없는 것을 스스로 알아낸다.”

이세돌과의 대국을 치룬 알파고의 핵심 기술 중 하나인 강화학습은 ‘MIT 테크놀로지 리뷰’에서 10대 혁신기술로 선정되었다. 강화학습의 개념은 100여년 전, 심리학자인 Edward Throndike에 의해 처음으로 문서에 등장하였으며, 1951년 Marvin Minsky의 몇 개의 튜브, 모터로 구성된 SNARC를 통해 구현되었다. 그 후, 수 십년을 잊혀진채로 있었던 강화학습은 왜 지금에 와서 다시 주목을 받고 있을까? 본 워크샵에서는 비즈니스 문제 적용의 관점에서 이론, 실습 그리고 예제를 통해 강화학습에 대해 깊이 알아보고자 한다. 강화학습은 왜 다시 주목을 받기 시작하였는지, 그리고 강화학습의 실무 적용 가능성 및 적용 사례에 대해 다루어 보고자 한다.

연사 소개

김진호.png

김진호 (경희대학교 빅데이터연구센터 연구원)

강의 경력
Deep Learning Short Course, SmartConnected.World, 2017
Hands-on Lecture, Reinforcement Learning with Python, SmartConnected.World, 2016
손에 잡히는 인공지능 : 연필과 오픈 소스로 익히는 인공지능, Makewith, 2017
An Introduction to Deep Learning #1, #2, SNS Open Seminar, 2016, 2017
C, Python and Deep Learning, 경희대학교 빅리더 4기, 2016

시간 내용
 10:00 – 10:50  Session 1. 강화학습이란 무엇인가?

  • 왜 강화학습은 MIT 선정 10대 혁신 기술이 되었는가?
  • 강화학습은 어떤 기술인가?
  • 강화학습으로 “풀 수 있는 실제문제”는 어떤 것이 있는가?
 11:00 –11:50 Session 2. 강화학습 시작하기

  • 강화학습의 구성 요소1, Action과Reward
  • Bandit Problem, 슬롯머신 중 가장 큰 보상을 주는 손잡이는?
  • 강화학습의 구성요소 2,State
  • Context  Bandit  Problem, 어떤 슬롯머신이 가장 큰 보상을 줄까?
12:00 – 13:30 점심
13:30 – 14:20 Session 3. Monte Carlo Policy Evaluation, Q-Learning

  • 강화학습 알고리즘 1.Monte Carlo Policy Evaluation
  • 강화학습 알고리즘 2.Q-Learning
  • 미로를 찾는 로봇을 어떻게 설계할 것인가?
  • 순환 외판원 문제를 어떻게 풀 수 있을 것인가?
14:30 – 15:20 Session 4. 딥러닝과 강화학습의 결합, Deep Q – Network

  • 강화학습 알고리즘 3.Deep Q-Network (DQN)
  • 강화학습 알고리즘 4.Double DQN
  • DQN을 활용한 Human-Level control: Atari BreakOut
15:30 – 16:20  Session 5. Double Dueling DQN and AlphaGo

  • 강화학습 알고리즘 5.Double Dueling DQN
  • AlphaGo, 어떻게 바둑을 두었는가?
  • 강화학습으로 사용자의 성향을 반영한 추천을 풀 수 있을 것인가?
16:20 – 17:30

Session 6.강화학습, 범용 알고리즘으로의 진화

  • 바둑,체스,장기를 정복한 AlphaZero,기보에 대한 학습은 없었다.
  • 비즈니스 문제를 어떻게 강화학습에 적용할 수 있을까?
17:40 –18:00   자유토론 및 Q&A
유의사항
  • 본 워크샵은 파이선 코드 실습과 함께 진행되오니, 노트북을 지참하시기 바랍니다.
  • 본 워크샵은 딥러닝, 파이선(TensorFlow)에 대한 기초적인 내용을 이해하고 오시면 효율적인 참여가 가능합니다.
 
문의처
E-mail : icbf98@khu.ac.kr
Tel: 02-961-0490