딥러닝이란 무엇인가 — 머신러닝과 역전파의 부활
네이버랩스 발표자가 작년에 이어 올해도 딥러닝을 주제로 무대에 오른다. '흥행한 영화의 속편은 부족하기 마련'이라는 농담으로 부담을 털어놓으면서도, 청중이 도움이 될 만한 것을 하나라도 가져가기를 바란다는 인사로 발표를 연다. 그는 먼저 딥러닝이 흔히 '뇌를 본뜬 인공지능'으로 이야기되지만 본질은 뉴럴 네트워크를 사용한 기계학습이라고 정리한다. 머신러닝은 데이터를 많이 모아 그 안에서 우리가 원하는 정보를 뽑아내는 규칙을 모델링하는 것으로, 음성 파형을 모델링하면 음성인식이, 두 언어의 상관관계를 모델링하면 번역이, 이미지를 카테고리로 학습하면 이미지 분류가 된다. LDA, 가우시안 혼합 모델, 협업 필터링의 행렬 분해 등이 모두 머신러닝의 한 갈래이며, 그중 뉴럴 네트워크를 이용한 것이 딥러닝이다.
뉴럴 네트워크를 학습시키는 방법은 역전파(backpropagation)인데, 이는 1980년대에 이미 확립된 전혀 새롭지 않은 방법이다. 그렇다면 왜 갑자기 요즘 와서 '딥러닝'이라는 이름으로 주목받느냐는 질문의 답은 단순하다. 엄청나게 잘 되기 때문이다. 실제로 네이버 음성인식은 오류율이 약 20% 개선됐고, 2012년 이미지넷 대회에서 딥러닝을 쓴 방법이 약 10%대 오류율로 26%대의 2등을 압도했다. 정체돼 있던 마이크로소프트 음성인식 오류율도 딥러닝 등장과 함께 극적으로 떨어졌다. 발표자는 1980년대에 끝난 듯했던 딥러닝을 부활시킨 세 가지 요인으로 오버피팅을 막는 새 알고리즘(힌튼·르쿤·벤지오), 인터넷 시대의 빅데이터, 그리고 약 300만 원대 GPU로 대표되는 하드웨어를 든다. 이 세 요인을 얼마나 잘 다루느냐가 결과를 가르며, 네이버는 이 구조로 N드라이브 사진을 내용만 보고 분류해 '동물 사진만 찾아 줘'를 처리하는 서비스를 출시했다고 소개한다.