Please enable JavaScript.
Coggle requires JavaScript to display documents.
인공지능과 학습(1520 오순진) - Coggle Diagram
-
1-2. 데이터 선정 및 수집하기
데이터 선정 시 고려 사항: 문제 적합성, 수집 가능성, 정보 보호, 데이터의 품질, 데이터 수집 비용
데이터 수집하는 다양한 방법: 인터넷 검색, 다양한 센서, 웹크롤링, 방문 수집
3-2. 기계학습 알고리즘의 이해
회귀: 어떤 현상에 영향을 미칠 수 있는 여러 요인과 특정 결과 사이의 관계를 함수로 푶현해 연속적인 수치를 예측하는 기계학습 방법
분류: 미리 정의된 여러 범주로 데이터를 구분하기 위한 경계를 학습하여 새로운 입력이 들어오면 여러 범주 중 하나 선택하는 방법
군집: 비지도학습 알고리즘의 일종
3-1. 기계학습의 유형
- 지도학습: 훈련 데이터(모델을 생성하는 데 활용)와 테스트 데이터(모델의 성능을 평가하는 데 활용)를 사용함.
검증 데이터: 모델을 학습하는 중간에 성능을 검증하기 위한 제이터로, 훈련 데이터의 일부를 검증 데이터로 활용함.
- 비지도학습: 정답 데이터 없이 입력 데이터만으로 이루어진 훈련 데이터를 사용하여 모델을 학습시키는 방법
- 강화학습: 판단할 때마다 외부 환경에서 보상을 제공하고, 이 보상의 값을 최대화하기 위한 방향으로 학습을 진행함.
과정: 1. 관찰 2. 정책을 따라 행동을 선택 3. 행동 실행 4. 보상이나 벌점을 받음 5. 정책 수정(학습 단계) 6. 최적의 정책을 찾을 때까지 반복
2-1. 데이터 전처리하기
결측치: 수집된 데이터에서 비어 있는 값 혹은 누락된 값
결측치 처리 방법: 결측치가 있는 행이나 열을 삭제 하거나 평균, 중앙값, 최빈값 등의 대푯값으로 결측치를 대체한다.
-
-
5-1. 인공신경망과 딥러닝
-
퍼셉트론: 모든 입력 값에 가중치를 곱하여 더한 값에 편향을 더한 후 활성화 함수를 서쳐 0 또는 1을 출력함
다층 퍼셉트론: 입력층(데이터를 입력받는 층) -> 은닉층(받은 값을 계산 후 다음 층으로 전달하며 학습이루어지는 층)-> 출력층(결괏값을 출력하는 층)
딥러닝: '학습한다'라는 것은 가중치와 편향을 찾아가는 과정
- 손실함수: 훈련 데이터를 잘 학습했는지 파악
- 최적화: 손실함수의 값이 최소가 되도록 가중치와 편향을 갱신하는 과정
- 경사 하강법: 무작위로 설정된 초기 가중치의 값을 수정하며 아래 방향으로 일정거리인 학습률만큼씩 이동함.
5-2. 딥러닝의 활용 분야
- 컴퓨터 비전의 대표적인 딥러닝 알고리즘은 합성곱 신경망이다.
- 음성 인식과 자연어 처리의 대표적인 딥러닝 알고리즘은 순환 신경망이다.
훈련 데이터와 테스트 데이트: 훈련 데이터로 성능을 평가하면 문제 유출처럼 과대평가될 수 있어, 훈련에 쓰지 않은 테스트 데이터로 실제 성능을 평가함.
렐루: 렐루 함수의 음수는 0으로, 양수는 그대로 출력하는 활성화 함수임.
소프트맥스: 3개 이상 클래스의 다중 분류에 쓰이며, 각 클래스의 예측 확률을 0~1 사이로 만들고 총합이 1이 되도록 하는 함수
MNIST 데이터셋: 미국 NIST가 고등학생과 인구조사국 직원의 손글씨로 만든 데이터셋으로, 딥러닝을 처음 배울 때 많이 사용함.
레이블과 클래스의 차이: 레이블은 구체적인 값이고, 클래스는 레이블들의 집합임. 하지만 둘은 비슷한 의미로 혼용하기도 함.
adam: 경사 하강법의 발전된 형태로, 광성릏 활용해 정확도를 높이고 일부 데이터만 사용해 빠르게 가중치를 업데이트하는 최적화 기법임.
-
지수 표기법(e): 정수 부분과 소수 뒤에 e와 지수를 써 숫자를 표현함. 예를 들어 1.0e+3은 1000, 1.0e-3은 0.001임.