Please enable JavaScript.

Coggle requires JavaScript to display documents.

2.인공지능과 학습(1525 정채은) - Coggle Diagram

- - - - 결측치 : 데이터 값이 비어 있거나 누락된 상태
      - 처리 방법 : 결측치가 있는 행이나 열을 삭제하거나 평균, 중앙값, 최빈값 등 대푯값으로 대체.
    - - 이상치 : 평균적인 데이터 범위보다 지나치게 높거나 낮은 수치의 값
      - 처리 방법 : 정상 범위의 기준을 정하고 삭제나 대체.
- - - - 인공신경망 : 인간의 신경망 구조를 모방하여 컴퓨터로 처리할 수 있도록 구현한 것.
      - 퍼셉트론(노드, 인공 뉴런) : 인공신경망을 실제로 구현한 연산 장치. 여러 개의 입력값을 처리해 0 또는 1을 출력. 인공신경망의 가장 작은 단위.
        *단층 퍼셉트론 : 입력층 1개와 출력층 1개로 이루어진 구조
        *다층 퍼셉트론 : 입력층, 은닉층, 출력층으로 이루어진 구조(복잡한 문제 해결 가능)
    - - 딥러닝 : 은닉층이 여러 개인 심층 신경망을 통해 학습하는 기계학습의 종류. 복잡한 문제를 해결할 수 있으나 오래 걸리고 과대적합이 발생할 수 있음.
        *과대적합 : 과부하와 같이 지나치게 데이터가 많이 저장되어 오류가 발생하는 것.
      - 딥러닝의 학습 : 가중치와 편향 찾기가 목표. 정보의 중요도에 따라 높거나 낮은 가중치를 곱하고 편향을 더함.
        *최적의 가중치와 편향 : 손실함수의 최솟값으로 기울기가 0인 지점
      - 활성화 함수
        
        시그모이드 함수 : S자 곡선을 그리는 함수. 출력값이 0과 1 사이. 입력값이 커질수록 출력값이 1에 가까워지고 작아질수록 0에 가까워짐.
        
        렐루 함수 : 입력값이 0보다 크면 입력값 그대로를, 0 이하면 0을 출력.
      - 손실함수 : 훈련 데이터를 잘 학습했는지 파악하는 함수. 예측값과 실젯값의 차이를 구함. 최적화를 통해 학습.
        *최적화 : 손실함수의 값이 최소가 되도록 가중치와 편향을 갱신하는 과정. 오차 역전파를 통해 이루어짐. 대표적으로 경사 하강법이 있음.
        *오차 역전파 : 순전파의 반대 방향으로 출력층에서 입력층으로 거슬러 가는 것.
        
        경사 하강법 : 최적화 방법 중 하나로 무작위로 설정된 초기 가중치의 값을 수정하며 기울기가 0이 될 때까지 학습하여 가중치와 편향을 수정하는 것. 속도가 느리고 계산량이 많음.
        (보완 알고리즘_확률적 경사 하강법, 미니 배치 경사 하강법, 모멘텀, 아담)
        
        손실함수 그래프 : 기울기가 0인 지점이 여러 개일 수 있음. 상대적 최저점을 글로벌이라 하고 나머지 최저점을 로컬이라 함.
      - 검증 데이터 : 훈련 데이터의 일부를 학습 중간 모델 성능 평가에 사용하는 것.
      - 활용 분야 : 비정형 데이터를 다룰 때 좋은 성능을 냄. 합성곱 신경망을 이용한 컴퓨터 비전, 순환 신경망을 이용한 음성 인식 및 자연어 처리 등에서 사용. 이외에도 다양한 분야에서 사용.
        
        컴퓨터 비전 : 컴퓨터의 활용을 통해 정지 영상이나 동영상을 분석하여 의미 있는 정보 추출.
        
        합성곱 신경망(CNN) : 동물의 시각 인지 과정을 모방한 인공신경망. 2차원 배열의 입력 데이터를 를사용해 데이터를 보존. 합성곱 계층과
        풀링 계층을 반복하여 학습 진행.
        *합성곱 계층 : 필터를 를적용해 이미지의 특성 추출.
        *풀링 계층 : 특성을 잘 드러내는 값을 선택.
- - - - 지도학습 : : 입력 데이터와 정답 데이터를 함께 제공. '훈련 데이터'로 모델을 생성하고 '테스트데이터'로 모델의 성능 평가.
      - 회귀(예측) : 어떤 형상에 영항을 미칠 수 있는 요인과 특정 결과 사이의 관계를 함수로 표현해 연속적인 수치를 예측. 훈련 데이터를 기반으로 독립 변수와 종속 변수 사이의 규칙을 파악해 수식으로 나타내고 새로운 값을 입력하면 예측값을 얻어냄.
        *독립 변수는 수로 입력값, 종속 변수는 주로 결괏값
        
        선형 회귀 알고리즘은 가설 함수를 찾고 최적화하며 학습. 산점도에 추세선을 그리고 y=wx+b의 형태로 표현. 손실함수를 이용해 오차 최소화.
      - 분류 : 여러 범주로 데이터를 구분하기 위한 경계 학습. 데이터가 어떤 클래스에 속하는지를 찾음.
        
        이진 분류 : 데이터를 2개의 클래스로 분류
        
        다중 분류 : 데이터를 3개 이상의 클래스로 분류
        
        대표 알고리즘
        
        로지스틱 회귀
        
        k-최근접 이웃 알고리즘 : 가장 가까이에 있는 k개의 학습 데이터가 가장 많이 속한 그룹을 따라 분류
    - - 비지도학습 : 정답 데이터 없이 입력 데이터만으로 학습. 훈련 데이터에 숨겨진 새로운 정보를 찾고자 할 때 유용.
      - 군집 : 데이터가 어떻게 그룹화되어야 하는지 미리 정의하지 않고 컴퓨터가 데이터 패턴을 스스로 찾아냄. 입력된 데이터의 특성을 분석해 서로 유사한 특성을 가진 데이터끼리 그룹화.
        
        대표 알고리즘 : k-평균 알고리즘 : 임의의 군집 중심으로부터 가까운 거리에 있는 데이터를 같은 군집으로 할당하고, 군집의 중심을 변경되지 않을때까지 계속 바꾸며 조정.
    - - 강화학습 : 판단할 때마다 외부 환경에서 보상 제공, 보상의 값을 최대화하기 위한 방향으로 학습.