Please enable JavaScript.
Coggle requires JavaScript to display documents.
ADSP 35회 오답노트 - Coggle Diagram
ADSP 35회 오답노트
데이터 분석
-
27번
:check:k-평균 군집
평균 등 거리 계산에 기반하므로 모든
변수가 연속적이어야 하고, 잡음이나 이상값에 민감하게 반응하는 단점이 존재한다.
-
-
-
-
-
36번
:check:과적합 방지 알고리즘
모형평가는 과대 적합에 대해 신뢰할 만한
추정값을 구하기 위해 훈련용, 평가용 데이터를 기반으로 한다.
:!:빅데이터 분석 모형을 검증하기 위한
대표적인 평가방법은 홀드 아웃 방법,
K-Fold Cross Validation, LOOCV,LpOCV,
부트스트랩 등이 있다.
40번
:check:선형 회귀모형
다중 선형 회귀 모형의 통계적 유의성은
F-통계량으로 확인하며, F-통계량의 p-값이 0.05보다 작으면 회귀모형은 통계적으로 유의
주관식
41번
:check:데이터베이스
데이터의 크기가 커지고 이용이 늘어나면서
대용량의 데이터를 저장,관리,검색,이용할 수
있는 데이터 집합
42번
:check:유전자 알고리즘
최적화가 필요한 문제의 해결책을 자연선택,
돌연변이 등과 같은 메커니즘을 통해
점진적으로 진화시켜 나가는 방법
-
-
47번
:check:홀드 아웃 방법
전체 데이터를 비복원 추출 방법을 이용하여
랜덤하게 훈련용 데이터, 평가용 데이터로
나눠 검증하는 기법
48번
:!:두 사건 A,B가 독립이라면
P(A|B) = P(B)
-
-