빅데이터 분석기사 오답노트

빅데이터 분석기사 오답노트 정리

 

우선순위 - 전략적 중요도, 비즈니스 성과, 실행 용의성

etc-image-0

빅데이터 수집기술 - 크롤링, 로그 수집기, Open API, ETL

etc-image-1

비정형 데이터 품질 기준 - 기능성, 신뢰성, 사용성, 효율성, 이식성

정형 데이터 품질 기준 - 완전성, 유일성, 유효성, 일관성, 정확성

etc-image-2

분석목표정의서 - 원천데이터 조사, 분석 방안 및 적용 가능성 판단, 성과평가기준

etc-image-3

일치성은 표본 크기가 증가할 수록 좋은 추정값을 제시

 

etc-image-4

사분위 편차

etc-image-5

평균 96.8 S= 6.72

 

 

 

etc-image-6

위상적 공간 데이터 - 공간 객체 간의 관계를 표현하며, 방위, 공간 객체 간의 중첩

etc-image-7

피어슨 상관계수

 

선형 상관계수

etc-image-8

이론적으로 무한번 시행하면 시행하면 수학적 확률로 수렴

etc-image-9

기각역 

 

임계치 : 유의수준 a에서 귀무가설의 채택과 기각에 관련

etc-image-10

다중회귀분석시 오차항은 상관이 없다 공분산은 0

etc-image-11

앙상블 여러 약한 모델을 결합하여 최적화 모데을 만드는 방식

etc-image-12

회귀 분석시 잔차들의 분산이 일정하며 1일 필요는 없다.

 

랜덤 포레스트는 투표를 통해서

etc-image-13

회귀분석에서 독립변수들 간에 강한 상관관계 다중공선성 문제

etc-image-14

비모수 많은 표본을 추출하기 어려운 경우 사용

etc-image-15

자기회귀모형에 대한 설명 - 일정 시점전으 ㅣ자료가 현재 자료에 영향을 준다는 가정하에 만듬

etc-image-16

분석모형 선정에는 분석모델 개발과는 상관 없음

etc-image-17

분석모델 시각화 KNN - qlrytlrkrghkrlqjq 

etc-image-18

군집분석의 주요 평가 지표가 아닌 것은 군집의 평균

 

딥러닝 모델 분석 결과 해석시 사용하는 오차율은 상대오자

 

etc-image-19

분석모델 시각화에서 회귀분석모델에서 사용안하는 것은 공간시각화

etc-image-20

CRISP-DM 방법론 전개단계에서 분석모델 평가는 평가단계

 

값 분포에 적합하지 않은 것은 평행좌표계

etc-image-21

확률적 경사하강법에 속도개념으로 가속화한 것은 모멘텀

etc-image-22

데이터 시각화 산점도는 두변수 사이의 관계를 표시

 

손실함수 최소가 되는 가중치 값인 중심점을 찾아 큰 가중치를 제한하는데 람다로 규제의 강도를 강하게 하면 가중치 값이 0에 가까웢ㅁ

etc-image-23