Python 실무 워크샵

참가 등록

강의자료 다운로드

일 시 : 2018년 7월 10일 (화) 10:00 ~ 18:00
장 소 : COEX, 3층 세미나룸
등 록 비 : (중식 포함) 사전 등록 12만원 / 현장 등록 15만원

빅데이터 및 머신러닝 관련 프로젝트를 수행하기 위해서는 다양한 프로그래밍 언어, 수리적 기초, 데이터베이스 등을 이해하여야 한다. 현재 빅데이터 및 머신러닝 분야들은 대부분 오픈소스를 기반으로 하고 있는데, 아주 많은 프로젝트들이 Python 기반으로 이루지고 있다. 본 워크샵은 Python을 이용한 빅데이터 및 머신러닝 개발 실무자를 위한 다양한 개발 실전을 익히는데 목적을 두고 있다. 이를 위해 기초통계 및 시각화를 이용한 EDA(Exploratory Data Analysis), feature engineering, 머신러닝 등의 최신동향을 살펴보고, 동시에 실습을 통한 실무 적용 능력을 키우기로 한다. 실습은 Jupyter notebook을 이용하여 직접 실행을 하게 되며, 이를 통해 기본적인 Python 패키지인 pandas, numpy 등의 이용법, kagglge.com을 이용한 다양한 머신러닝 기법 습득, keras를 이용한 머신러닝 적용, decision tree 및 다양한 변형 tree 적용 등도 같이 다루게 된다. 또한 국내에서 실제 빅데이터 및 머신러닝을 적용하기 위해서 필요한 공공데이터들을 알아보고, 이를 Python으로 다루는 방법들도 실습을 하게 된다.

연사소개

김후곤 소장.png

김후곤
벤플 연구소장 / 공학박사

한국과학기술원(KAIST) 경영과학과 정보통신 연구실에서 석사 및 박사 학위를 취득했다. 경성대학교 교수로서 경영정보, 데이터베이스, 웹프로그래밍 등을 강의 해 오고 있으며, 최근에는 빅데이터 및 인공지능과 관련된 연구에 집중하고 있다. 2000년대에는 주로 KT, LG U+ 등과 통신 관련 프로젝트들을 수행하였고, 최근에는 온실가스 및 공공데이터를 이용한 빅데이터 및 알고리즘 개발 등을 집중적으로 연구하고 있다. Markdown 문서를 누구나 쉽게 만들수 있는 mdhub.io를 운용하고 있으며, Python을 이용한 웹서버 개발, 빅데이터 및 머시러닝 알고리즘 개발, 고객 기반 빅데이터 처리 프레임웍 개발, 공공데이터를 이용한 다양한 문제해결 방안, NoSQL(mongoDB 등)을 이용한 다양한 빅데이터 처리 방안 등에 대한 자문 및 프로젝트 들을 수행하고 있다.

시간 내용
 10:00 – 11:50 Session1. 빅데이터 및 머신러닝 개요

  • 빅데이터 및 머신러닝
  • 머신러닝 기본 원리
  • EDA(Exploratory Data Analysis)
  • feature engineering
  • 시각화
  • 머신러닝 기본 개념들
  • 머신러닝 분류
  • 머신러닝 모형
12:00 – 13:30 점심
13:30 – 14:20 Session2. Python 개발 환경 설정

  • anaconda 설치
  • spyder 소개
  • jupyter notebook 소개
  • jupyter notebook 기본 개념 : markdown과 cell
  • jupyter notebook 실습
14:30 – 15:20 Session 3. 기본 패키지 실습

  • Pandas 및 SQL
  • numpy
  • 시각화 : matplotlib, seaborn, bokeh, vega
15:30 – 16:20 Session 4. kaggel.com을 이용한 다양한 예제

  • kaggle.com 소개
  • 공개 dataset
  • kernel 실습
  • kaggle의 장단점
16:30 – 17:20

Session 5. keras 실습

  • ann(MLP) 실습
  • cnn 실습
  • rnn 실습
  • decision tree 및 다양한 변형 tree들 소개
17:30 –18:00   자유토론 및 Q&A
문의처