Please enable JavaScript.
Coggle requires JavaScript to display documents.
인공지능과 학습 (1428홍수민) - Coggle Diagram
-
데이터 전처리와 핵심속성 추출
데이터 전처리하기
-
결측치 처리하기
결측치가 있는 행이나 열을 삭제하는 방법
데이터의 손실이 크지 않은지, 꼭필요한 데이터는 아닌지 따져보고 신중하게 결정해야한다.
평균,중앙값, 최빈값 등의 대푯깂으로 결측치를 대체하는 방법
-
핵심 속성 추출하기
-
핵심 속성 이해하기
핵심 속성: 문제 해결에 꼭 필요한 속성, 해결하고자 하는 문제와 상황에 따라 필요한 속성이 달라질수있다.
-
기계학습의 유형과 알고리즘
기계학습의 유형
-
비지도학습: 입력데이터 만으로 이루어진 훈련 데이터를 사용하여 모델을 학습 , 정답데이터가 없기에 컴퓨터 스스로 특징을 분석해 패턴이나 규칙을 탖아야한다,
훈련데이터의 새로운 정보를 찾고자 할떄 유용하고, 간단화 시켜 속성을 추출하는 차원축소, 군집,이상치 탐지 등에 적합하다.
강화학습: 판단할 때마다 보상을 제공하고, 보상을 늘리기 위한 방향으로 학습 진행
명확한 정답이 없는 상황이기에 지능 에이전트 학습과정에 유용함, 소비 패턴 분석을 통한 마케팅 전략 수립등 최적화 문제에 활용됨
알고리즘의 이해
회귀: 여러 요인과 특정 결과 사이 관계를 함수로 표현, 연속적인 수치를 예측하는 기계학습 방법
학습한 모델을 사용하여 새로운 입력값의 수치 예측
-
분류 : 여러 범주로 데이터를 구분하기 위한 경계를 학습하고 새로운데이터를 범주중 하나로 선택하는 과정
지도학습의 형태, 어떤 글래스에 속하는지 찾는것
예) 로지스틱 회귀, k- 최근접 이웃
-
군집: 비지도 학습 알고리즘, 그룸화 방법을 정의하지 않고 데이터 패턴을 스스로 찾아내게하는 방식
입력된 데이터의 특성을 분석하여 그룹화함
K-평균 알고리즘: 중심으로부터 가까운 거리에 있는 같은 군잡읋 할당,중심을 변경되지 않을때까지 계속 바꾸며 조정
딥러닝의 이해와 활용
인공 신경망과 딥러닝
-
딥러닝은 여러개의 은닉층을 포함하여 만든 심층 신경망을 통해 학습이 이루어지도록하는 기계학습의 한 방법
은닉층이 많아지면 더 복잡한 문제 해결가능 하지만 시간이 오래걸리고 과대 적합이 발생할수있음
답러닝의 학습 원리 , 목표: 최적의 가중치와 편향
정보의 중요도에 따라 신호의 세기가 달라짐 - 중요 정보는 높은 가중치, 반대는 낮은 가중치 곱해 소멸시킴. 원하는 결과가 나오도록 편향을 더해 조정함
최적의 가중치와 편향: 손실함수의 최솟값, 기울기가 0인지점
-
손실함수: 훈련데이터를 잘 학습했는지 파악하는 함수로 예측값과 정답의 차이를 구하는 함수. 일치-작음, 불일치-큼
최적화: 손실함수의 값이 최소가 되도록 가중치와 편향을 갱신하는 과정,
오차 역전파를 통해 이루어짐
대표적으로 경사하강법이 있다.
경사 하강법: 무작위로 설정된 초기 가중치의 값을 수정하며 아래 방향으로 일정거리인 학습률 만큼씩 이동. 기울기가 0이 될때까지 수정
단점: 전체 데이터의 기울기를 구해야해서 오래걸림, 계산량이 많음
보완하고자 확률적 경사 하강법, 미니 배치 경사 하강법, 모멘텀, 아담 등이 있다.
딥러닝의 활용 분야
-
-
순환 신경망(RNN)
음성 인식 및 자연어 처리
-
-
-
동작 원리
음성 입력
음성 인식
자연어 처리
-
- 형태소 분석
- 구문 분석: 의존관계
- 의미 분석
- 담화, 의도 분석
-
-
-
-
-