Please enable JavaScript.
Coggle requires JavaScript to display documents.
2.인공지능과 학습
(1512 박선유) - Coggle Diagram
2.인공지능과 학습
(1512 박선유)
-
기계학습을 통한 문제 해결 과정
1.훈련 데이터 수집
-입력-
2,인공지능 학습하기
3.인공지능 모델
-입력-
4.문제 해결을 위한 새로운 데이터
-출력-
5.결과(정보)
문제 상태 정확히 파악,정의할 수 있어야함.
현재상태,목표상태가 무엇인지,활용해야하는 핵심요소는 무엇인지 등을 정확히 분석
문제 해결을 위한 데이터
-
만약 훈련데이터의 질 저하,데이터양 충분하지 않으면 기계학습 모델의 성능은 높지 않을 것임,수집한 훈련 데이터가 편향을 띤다면 이 데이터를 이용한 학습 결과도 부정확함
데이터 선정하기
[데이터 선정 시 고려사항]
문제 적합성,수집 가능성,정보 보호,데이터의 품질,데이터 수집 비용
데이터 수집하기
[데이터 수집 시 고려사항]
- 기계학습을 위해 충분한 양의 데이터인가
2.편향되지 않은 데이터인가
3.필요한 속성에 대한 내용을 담고있는 데이터인가
4.신뢰 가능한 최신의 데이터인가
-
-
데이터 전처리하기
-
결측치:비어있는 값,누락된 값
이상치:평균보다 지나치게 높거나 낮은 값
결측치 처리하기
1.행렬 삭제 2.평균,중앙값,최빈값 등의 대표값으로 대체
-
핵심 속성 이해하기
데이터는 관찰이나 실험을 통해 수집되는 값,
하나의 데이터는 여러개의 속성으로 구성됨
데이터 속성:데이터를 설명하는 특징,성질
기계학습에 어떤 영향을 미치는지 확인해야됨
-
기계학습의 유형
-
-
강화학습
판단할 때마다 외부 환경에서 보상을 제공하고, 이 보상의 값을 최대화하기 위한 방향으로 학습을 진행
-
기계학습 알고리즘의 이해
-
-
분류:미리 정의된 여러 범주로 데이터를 구분하기 위한 경계를 학습하여 새로운 입력이 들어오면 여러 범주 중 하나를 선택하는 과정,지도학습의 한 형태 즉 데이터가 어떤 클래스에 속하는지를 찾는 것
이진 분류:주어진 데이터를 2개의 클래스로 분류하는 것, 다중 분류:주어진 데이터를 3개 이상의 클래스로 분류하는 것
로지스틱 회귀,K-최근접 이웃알고리즘이 있음 그중 k-최근접 이웃 알고리즘은 새로운 데이터를 분류하기 위해 가장 가까이에 있는 k개의 학습 데이터가 가장 많이 속한 그룹을 따라 분류하는 모델
-
딥러닝의 이해와 활용
퍼셉트론:인공신경망을 실제로 구현한 연산 장치, 여러개 입력값 처리,하나의 결괏값인 0또는 1을 출력하는 인공신경망의 가장 작은 단위
입력층 1개,출력층 1개로 이루어진 구조:단층 퍼셉트론
-
-
단층 퍼셉트론은 복잡한 문제 처리 못 함
그래서 다층 퍼셉트론 등장
입력층,은닉층,출력층의 구조를 갖춤
-
-
-
-
-
최적화:손실함수의 값이 최소가 되도록 가중치와 편향을
갱신하는 과정,오차 역전파를 통해 이루어짐
대표적인 방법:경사 하강법
경사 하강법:무작위로 설정된 초기 가중치의 값을 수정하며 아래 방향으로 일정 거리인 학습률만큼 이동
딥러닝 활용
농업,컴퓨터 비전,자연어 처리,의료,금융,쇼핑 등에 활용됨
-
-
딥러닝으로 손글씨 뷴류하기
1,문제 정의하기-렐루,소프트맥스
2.데이터 수집 및 전처리하기
3.딥러닝과 알고리즘 선정하기
4,성능 평가하기
-