Please enable JavaScript.

Coggle requires JavaScript to display documents.

인공지능과 학습 (1428홍수민) - Coggle Diagram

- - - - 전통적 프로그래밍은 규칙을 프로그래머가 직접만들고 알고리짐에 데이터를 입력하면 결과를 출력한다.
  - - - 컴퓨터가 데이터를 통해 스스로 학습하고 기계학습 모델을 민들로록 프로그래밍해 문제를 해결핡수있다.
    - - 인공지능 학습하기
        
        인공지능 모델
        
        문제해결을 위한 새로운 데이터
        
        결과 (정보)
    - - 우수한 품질의 데이터가 충분히 있는가
        
        모델을 생성할수있는가
        
        조건들에 따라 해결가능성이 높은 문제와 그렇지 않은 문제를 구분할수있다.
    - - 데이터 수집시 개인의 주관이 들어가지 않은 데이터를 수집한다
        
        데이터의 양과 질에 편향성이 포함되어 있지 않은지 확인한다
        
        데이터셋에 어떤 데이터가 들어 있는지에 대한 정보를 함께 보관한다
      - 편향이란 한쪽으로 치우치는 성질을 의미한다.
  - - - 문제 적합성
        
        수집 가능성
        
        정보보호
        
        데이터의 품질
        
        데이터 수집비용
    - - 고려사항
        
        기계학습을 위해 충분한 양의 데이터인가?
        
        편향되지 않은 데이터인가
        
        필요한 속성에 대한 내용을 담고있는 데이터인가
        
        신뢰가능한 최신의 데이터인기
      - 데이터셋은 주제별로 모은 데이터의 집합을 말한다
        
        api란 응용프로그램 개발에 활용가능한 인터페이스를 의미한다
        공공기관이나 기업에서는 데이터셋을 파일 또는 api형태로 만들어 공공데이터로 제공하기도 한다.
- - - - 데이터 전처리를 통해 가고오딘 데이터를 사용하면 기계학습의 분석결과를 왜곡시키거나 성능을 떨어뜨리는 것은 방지할수있다.
    - - 결측치가 있는 행이나 열을 삭제하는 방법
        
        데이터의 손실이 크지 않은지, 꼭필요한 데이터는 아닌지 따져보고 신중하게 결정해야한다.
      - 평균,중앙값, 최빈값 등의 대푯깂으로 결측치를 대체하는 방법
    - - 마찬가지로 이상치를 포함하는 행을 삭제할수있으며 하지만 그때는 모든 맥락을 고려한후 신중하게 결정해야한다
        
        데이터가 충분하지 않다면 적합값을 대체 해야함 (평균 등)
  - - - 하나의 데이터에는 여러개의 속성으로 구성됨
        데이터 속성이란 데이터를 설명하는 특징이나 성질을 의미한다.
        
        수치형(숫자값)
        
        연속형(실수형): 소수점 o
        
        이산형(정수형): 일반적 정수
        
        텍스트 범주형
    - - 핵심 속성: 문제 해결에 꼭 필요한 속성, 해결하고자 하는 문제와 상황에 따라 필요한 속성이 달라질수있다.
    - - 시각화 하면 문제 해결에 필요한 속성을 직관적으로 파악할 수 있다.
        
        막대그래프 , 히스토그램. 원그래프, 산점도, 히트맵 핵심속성 추출시에는 보통 히트맵을 쓴다.
        
        히트맵: 상관계수가 -1부터 1까지의 양과 음의 상관관계를 시각화해 색으로 나타낸다.
- - - - 훈련데이터: 학습모델을 만들기 위해 사용됨
        테스트 데이터: 모델의 성능을 평가하는데 활용
        
        지도학습이 끝난후 회귀(예측) 과 분류 등의 작업을 할수있다.
    - - 훈련데이터의 새로운 정보를 찾고자 할떄 유용하고, 간단화 시켜 속성을 추출하는 차원축소, 군집,이상치 탐지 등에 적합하다.
    - - 명확한 정답이 없는 상황이기에 지능 에이전트 학습과정에 유용함, 소비 패턴 분석을 통한 마케팅 전략 수립등 최적화 문제에 활용됨
  - - - 선형 회귀 알고리즘: 오차를 최소화하는 가설함수를 찾고 최적화 하여 학습 진행
    - - 이진 분류: 주어진 데이터를 2개의 클래스로 분류
        다중분류 : 주어진 데이터를 3개 이상의 클래스로 분류
        
        k- 최근접 이웃: 가장 가까이에 있는 k개의 데이터가 가장 많이 속한 그룹을 따라 분류함
    - - K-평균 알고리즘: 중심으로부터 가까운 거리에 있는 같은 군잡읋 할당,중심을 변경되지 않을때까지 계속 바꾸며 조정
- - - - 퍼셉트론은 인공신경망을 실제로 구현한 연산장치, 여러갸의 입력값을 처리해 하나의 결과값인 0또는 1을 출력하는 가장 작은 단위
        수상돌기: 데이터 입력
        신경세포체: 데이터 처리
        축삭돌기: 데이터 출력
        노드, 인공뉴런으로도 불림
        
        단층 퍼셉트론은 입력층, 은닉층, 출력층으로 이우러져 있고
        복잡한 문재 초리를 위해 다츨 퍼셉트롬 만듬, 은닉층이 여러개
    - - 정보의 중요도에 따라 신호의 세기가 달라짐 - 중요 정보는 높은 가중치, 반대는 낮은 가중치 곱해 소멸시킴. 원하는 결과가 나오도록 편향을 더해 조정함
        최적의 가중치와 편향: 손실함수의 최솟값, 기울기가 0인지점
        
        활성화 함수: 딥러닝에서 일정한 임계값을 넘는지 판단후 정보의 전달 유무 결정
        대표적으로 시그모이드 함수와 렐루함수가 있다.
        
        손실함수: 훈련데이터를 잘 학습했는지 파악하는 함수로 예측값과 정답의 차이를 구하는 함수. 일치-작음, 불일치-큼
        
        최적화: 손실함수의 값이 최소가 되도록 가중치와 편향을 갱신하는 과정,
        오차 역전파를 통해 이루어짐
        대표적으로 경사하강법이 있다.
        
        경사 하강법: 무작위로 설정된 초기 가중치의 값을 수정하며 아래 방향으로 일정거리인 학습률 만큼씩 이동. 기울기가 0이 될때까지 수정
        단점: 전체 데이터의 기울기를 구해야해서 오래걸림, 계산량이 많음
        
        보완하고자 확률적 경사 하강법, 미니 배치 경사 하강법, 모멘텀, 아담 등이 있다.
  - - - 컴퓨터 비전
        
        이미지, 환경 인식
        
        예시
        
        자율주행 자동차
        
        이미지 생성
        
        얼굴 인식
        
        객체 탐지
        
        이미지 분류
      - 동물(인간포함)의 시각 인지 과정 모방
      - 이미지 처리에 높은 성능
      - vs 심층 신경망
        
        2차원 데이터를 1차원 형태로 변환
        
        이미지의 생김새 정보 잃게 됨
      - 원래 이미지가 갖고 있던 데이터 구조(변환 없이 2차원 배열 입력 데이터) 사용
        
        그대로 학습
        
        특성 잘 추출
        
        이미지 분류
        
        사물 탐지
        
        이미지 분할
      - 원리
        
        합성곱 계층
        
        도장 찍듯이 필터 적용
        
        이미지 특성 추출
        
        풀링 계층
        
        값을 선택하는 과정 반복
        
        두계층을 반복하여 학습
        
        이미지 특성 추출
        
        곱하고 더함
    - - 음성 인식 및 자연어 처리
        
        변환된 텍스트 파악하는 자연어 처리 기술
        
        잡음제거 및 소리 보정 기술
        
        음성을 텍스트로 변환하는 기술(STT)
        
        동작 원리
        
        음성 입력
        
        음성 인식
        
        자연어 처리
        
        명령 수행 및 상호 작용
        
        형태소 분석
        
        구문 분석: 의존관계
        
        의미 분석
        
        담화, 의도 분석
        
        음성 신호
        
        부호화
        
        특징 추출
        
        패턴 비교
        
        인식
      - 관계, 순서가 중요한 순차적인 데이터
        
        딥러닝 모델
        
        자연어 처리
        
        시계열 데이터 처리
        
        시간의 흐름에 따라 순차적으로 기록된 데이터.
        미래를 예측하는 문제
      - 구조
        
        심층 신경망과 유사
        
        중간 출력은 은닉상태
        
        데이터의 중간 결과 기억
        
        이전 입력값이 고려된 현재의 입력값에 따라
        
        출력값 결정
        
        문장을 모두 읽고 최종적으로 감정을 도출하는 문제에 적합
      - 자연어 처리 예시
        
        챗봇
        
        텍스트 생성
        
        음성 인식
        
        감정 분석
        
        언어 번역
        
        지능형 개인 비서
- - - - 기계 학습은 핵심속성을 사람이 추출해야함 딥러닝은 데이터만 입력해주면 됨
      - 딥러닝과 알고리즘 선정하기 : 1. 인공신경망 모델 구조 만들기 2. 인공신경망 학습시키기
        
        성능 평가하기: 함수를 사용해 성능을 확인한다.