Please enable JavaScript.
Coggle requires JavaScript to display documents.
2.인공지능과 학습(1525 정채은) - Coggle Diagram
2.인공지능과 학습(1525 정채은)
기계학습과 데이터
기계학습을 통한 문제 해결
- 훈련 데이터 수집
- 인공지능 학습하기
- 인공지능 모델
- 문제 해결을 위한 새로운 데이터
- 결과
필요 요소 : 문제 상태, 현재 상태, 목표 상태, 핵심 요소
기계학습을 통해 해결할 수 있는 문제인가
: 훈련 데이터의 양과 질, 활용하는 프로그램의 성능, 앞으로의 기술 발전 양상에 따라 달라질 수 있음. 그러나 충분한 양과 우수한 품질을 갖춘 데이터가 있는지 적합한 모델을 생성할 수 있는지에 따라 구분 가능.
문제 해결을 위한 데이터
조건
- 질이 좋아야 함
- 양이 충분해야 함
- 편향을 띠지 않아야 함
- 적합한 속성이 부족하지 않아야 함
데이터 공정성 : 데이터 수집, 처리, 사용, 공유 과정에서의 공평성과 투명성
- 데이터 수집 과정의 공정성
- 데이터 처리 및 분석의 공정성
- 데이터 사용의 공정성
- 투명성과 설명 가능성
데이터 선정 및 수집
선정 시 고려 요인
- 문제 적합성
- 수집 가능성
- 정보 보호
- 데이터의 품질
- 데이터 수집 비용
데이터 수집 방법
- 인터넷 검색
- 웹 크롤링
- 다양한 센서
- 방문 수집
API : 기업이나 공공 기관에서 데이터셋을 제공하는 형태. 응용 프로그램 개발에 활용 가능한 인터페이스를 의미. 프로그램을 개발할 때 API를 통해 원하는 기능을 제공받아 사용 가능.
-
데이터 전처리와 핵심 속성 추출
데이터 전처리
결측치 처리
-
처리 방법 : 결측치가 있는 행이나 열을 삭제하거나 평균, 중앙값, 최빈값 등 대푯값으로 대체.
-
핵심 속성 추출
-
-
추출 방법
1.히트맵 : 히트맵은 상관관계를 시각화한 그래프로 색을 이용해 배열을 나타냄.
2.산점도 : 두 변수 간의 관계를 나타내기 위해 x축과 y축의 값이 교차되는 지점에 점을 찍어 시각화한 것. 독립변수와 종속변수가 있음.
딥러닝의 이해와 활용
인공신경망과 딥러닝
인공신경망과 퍼셉트론
-
퍼셉트론(노드, 인공 뉴런) : 인공신경망을 실제로 구현한 연산 장치. 여러 개의 입력값을 처리해 0 또는 1을 출력. 인공신경망의 가장 작은 단위.
*단층 퍼셉트론 : 입력층 1개와 출력층 1개로 이루어진 구조
*다층 퍼셉트론 : 입력층, 은닉층, 출력층으로 이루어진 구조(복잡한 문제 해결 가능)
딥러닝
딥러닝 : 은닉층이 여러 개인 심층 신경망을 통해 학습하는 기계학습의 종류. 복잡한 문제를 해결할 수 있으나 오래 걸리고 과대적합이 발생할 수 있음.
*과대적합 : 과부하와 같이 지나치게 데이터가 많이 저장되어 오류가 발생하는 것.
-
활성화 함수
-
렐루 함수 : 입력값이 0보다 크면 입력값 그대로를, 0 이하면 0을 출력.
손실함수 : 훈련 데이터를 잘 학습했는지 파악하는 함수. 예측값과 실젯값의 차이를 구함. 최적화를 통해 학습.
*최적화 : 손실함수의 값이 최소가 되도록 가중치와 편향을 갱신하는 과정. 오차 역전파를 통해 이루어짐. 대표적으로 경사 하강법이 있음.
*오차 역전파 : 순전파의 반대 방향으로 출력층에서 입력층으로 거슬러 가는 것.
경사 하강법 : 최적화 방법 중 하나로 무작위로 설정된 초기 가중치의 값을 수정하며 기울기가 0이 될 때까지 학습하여 가중치와 편향을 수정하는 것. 속도가 느리고 계산량이 많음.
(보완 알고리즘_확률적 경사 하강법, 미니 배치 경사 하강법, 모멘텀, 아담)
-
-
활용 분야 : 비정형 데이터를 다룰 때 좋은 성능을 냄. 합성곱 신경망을 이용한 컴퓨터 비전, 순환 신경망을 이용한 음성 인식 및 자연어 처리 등에서 사용. 이외에도 다양한 분야에서 사용.
-
음성 인식과 자연어 처리
동작 원리
- 음성 입력
- 음성 인식
2-1. 음성 신호
2-2. 부호화
2-3. 특징 추출
2-4. 패턴 비교
2-5. 인식
- 자연어 처리
3-1. 형태소 분석
3-2. 구문 분석
3-3. 의미 분석
3-4. 담화,의도 분석
- 명령 수행 및 상호 작용
예시 : 인공지능 비서, 기계 번역 소프트웨어, 감성 분석
순환 신경망(RNN) : 데이터 간의 관계나 순서가 중요한 순차적인 데이터를 입력받아 결과 도출. 주로 시계열 데이터 등을 처리. 은닉 상태에서 데이터의 중간 결과 기억.
*시계열 데이터 : 시간의 흐름에 따라 순차적으로 기록된 데이터.
기계학습의 유형과 알고리즘
기계학습의 유형
지도학습
-
회귀(예측) : 어떤 형상에 영항을 미칠 수 있는 요인과 특정 결과 사이의 관계를 함수로 표현해 연속적인 수치를 예측. 훈련 데이터를 기반으로 독립 변수와 종속 변수 사이의 규칙을 파악해 수식으로 나타내고 새로운 값을 입력하면 예측값을 얻어냄.
*독립 변수는 수로 입력값, 종속 변수는 주로 결괏값
-
-
-
강화학습
강화학습 : 판단할 때마다 외부 환경에서 보상 제공, 보상의 값을 최대화하기 위한 방향으로 학습.
딥러닝으로 손 글씨 분류하기
기계학습과 딥러닝의 차이점
기계학습
- 핵심 속성을 사람이 추출.
- 속성 추출에 많은 시간 소요.
딥러닝
- 스스로 핵심 속성 추출.