최대 1 분 소요

CS231n lecture1

CS231n 강의를 듣고 내용을 정리해 올립니다. 스탠포드 대학(YouTube channel: Stanford University School of Engineering)의 강의입니다. 업로드된 강의명:’Lecture 1 | Introduction to Convolutional Neural Networks for Visual Recognition’

이미지 입력 -> 가장자리 이미지 -> 2와 1/2-D 스케치 -> 3-D 모델

일반적 원통형 표현(브룩스&빈포드, 1979)과 픽토리얼 구조(피셔&엘슐랭거, 1973) <- 기초 아이디어: 모든 사물은 간단한 기하학적 배열로 구성되어 있다.

선, 모서리로 이미지 인식 (데이비드 로, 80년대)

정규화 나누기(시&말릭, 1997) : 의미있는 구간의 픽셀로 그룹을 나눔. 얼굴 탐지 기술(비올라&존스, 2001) <- 에이다부스트 알고리즘 활용, 실시간 탐지 가능 (*에이다부스트AdaBoost : Adaptive + Boosting)

SIFT (데이비드 로, 1999) : 두 사진 속 비슷한 물체의 점과 점 연결(사진의 앵글, 초점, 빛 상관 x)

공간 피라미드 매칭(슈미트&퐁세, 2006) : 다른 부분, 다른 해상도의 이미지를 합침 (서포트 벡터 머신 활용)

파스칼 VOC(PASCAL Visual Object Challenge): 20개 범주 사물 분류 가능. (사람, 기차, 비행기, 병, 소, 고양이 등)

이미지넷 프로젝트 : 2만2천 범주, 1천4백만 이미지. 2012년부터 오류 급하락

NEX-UIUC(2010)-SuperVision(2012)-GoogLeNet(2014)-MSRA(2015)

알아야 할 수학: 대학미적분학, 선형대수학