딥러닝:개요

틀:딥러닝이론 딥러닝을 위한 자료. 이론에 대해 다룬다.

개요

머신러닝 중 인공신경망 알고리즘을 사용하여 만든 것.

ANN(Artificion Neural Network). 인간의 신경망(뇌)을 모방하여 지능을 구현한 것. 가지줄기에서 신호를 받고, 세포체에서 입력받은 값을 통합하고 축색돌기를 통해 다른 뉴런으로 전달한다.

역사


년도	사건
1956	인공지능이라는 용어 탄생
1974	첫번째 겨울. 낙관론이 무너지면서 찾아왔다. 1980년대 국가적 대규모 투자가 이루어지면서 겨울이 끝났다.
1987	두번째 겨울. 대규모 투자의 성과가 시원찮아 찾아왔다.
1993	딥러닝 기술 탄생. 두 번째 겨울을 지나던 중 학자들의 꾸준한 연구로 딥러닝이 탄생한다. 이후 층이 깊어질 때의 문제점을 해결하거나 실제 산업에서 사용하면서 다시금 붐이 불기 시작한다.

전망

전망	기반
희망적 전망	스마트스피커, 번역, 인식 등 실생활에서 접하고 있는 것들이 많다. 불량품 검출, 등에서 사용. AI네오라는 아이가 석달 수익률이 10%가 조금 안되며 골드만삭스를 제쳤다. '산타토익' 서비스. 영어학습에서 성공적으로 적용되고 있는 사례.
부정적 전망	폐암진단정확도 18%, 자율자동차 사고 속출, 강아지와 머핀 사진, 베이글과 강아지, 강아지와 크로와상의 구분이 잘 되지 않는다. 사람처럼 구분하는 시기가 언제즘 올지 누구도 예측할 수 없다. 2015.6 폭스바겐 제조로봇 오작동으로 엔지니어 사망 2016.2 구글의 무인자동차는 시험주행 중 버스와 사고 2016.3 ms언어습득로봇이 인종차별적 표현을 사용하여 가동 중단 2016.7 미국 경비로봇 오작동으로 16개월 아기 공격 윤리적으로 민감한 상황에 인공지능 도입은 시기상조라는 의견.
종합	오류가 나도 심각한 문제가 없으면서 단순반복작업을 대체할 수 있다.(온라인 광고 이미지 자동검수, 복잡도가 높은 시스템을 대체하면서 인간의 업무에서 보조적인 역할은 충분히 해줄 수 있다. 2012 이미지분류대회에서 이전 우승작보다 10% 가량 높은 역량을 보이며 심층합성곱 기법이 주목받기 시작 2015년에 정확도가 96.4%로 이미지분류문제는 완전히 해결된 것으로 간주하게 되었다. 특성공학이 딥러닝으로 인해 자동화되었다. CPU처리속도의 향상과, GPU의 발전으로 병렬처리능력 향상 등 하드웨어의 발전과, 인터넷의 성장으로 데이터의 대량수집이 가능하게 되었다.

인공지능?

1950년대 '컴퓨터가 생각할 수있는가'라는 질문과 사람의 수행을 자유로하하기 위한 목적에서 나왔다.

규칙을 기반으로 데이터를 넣으면 기대되는 해답을 얻는다.

머신러닝?

연산결과에 따라 스스로 규칙을 수정하는 기능. 학습을 통해.

데이터와 기대되는 해답을 기입하면 규칙을 얻어낸다. 더 나은 표현을 찾는 과정을 자동화한 것이다.

역사

전망	기반
1950년대
	결정트리 랜덤포레스트 : 결정트리에 기반한 것으로, 많은 결정트리를 사용하고 나중에 이를 합친다. 그래디언트 부스팅 머신 : 랜덤포레스트와 유사하지만, 이전 모델에서 놓친 데이터를...

지도학습과 비지도학습

지도학습은 학습할 데이터를 지정해주는 것. 데이터에 따라 모델을 학습시키고, 학습시킨 모델로 새로운 입력에 대한 예측을 한다.

비지도학습은 타깃이 없는 데이터를 사용한다. 무작위한 데이터를 분류하여 그룹화 하거나 새로운 그룹을 만드는 것. 타깃이 없어, 훈련결과를 평가하기 어렵다.

강화학습

행동에 따라 보상과 현재상태에 대한 피드백으로 훈련한다.

Q러닝, SARSA, DQN(Deep Q Network) 등의 알고리즘이 있다.

딥러닝?

인공신경망을 이용해 만드는 인공지능 알고리즘.

머신러닝의 한 분야로, 연속된 층에서 점진적으로 의미있는 표현을 학습한다. 층이 깊어질수록 데이터의 순도가 높게 정제되는 형태이다.

'인지'와 관련한 문제를 잘 해결한다. 정형데이터에 대해선 다른 전략에 밀리는 경향이 있음.

응용

글자가 있는 부분의 이미지 인식>잘라내기>텍스트인식 순으로, 2개의 딥러닝을 사용한다.

병해충 검색. 감염부위촬영>업로드>진단 및 응답

영상인식 : 분류모델

예측시스템 : LSTM모델(알고리즘)

기본용어

인공신경망

뉴런의 모양을 모방해 신호를 받고 처리 후, 활성화함수를 통해 출력값을 내보낸다.

or, and, not 연산이 기본이 된다.

다층신경망

단일신경망에선 xor연산이 불가능하다.

인공신경망에 은닉층을 사용하여 계산한다. 은닉층은 데이터의 특성을 파악하는 역할을 한다.

은닉층 하나를 추가할 때마다 계산량은 지수적으로 늘어난다.

손실함수

손실점수를 피드백으로, 이 값이 감소되는 방향으로 가중치 값을 점차 수정한다.

역전파 알고리즘

역방향으로 가중치 오차를 전파해 학습결과를 찾아나간다. 일정 오차범위 안에 들어가면 알고리즘을 종료시킨다.

목표치에서 나온 오차를 줄이기 위해 가중치를 조절한다. 각 가중치들을 독립적으로 수정할 수 있어야 한다. 학습률을 임의로 설정한다.