빅데이터 분석기사 오답노트 정리
우선순위 - 전략적 중요도, 비즈니스 성과, 실행 용의성
빅데이터 수집기술 - 크롤링, 로그 수집기, Open API, ETL
비정형 데이터 품질 기준 - 기능성, 신뢰성, 사용성, 효율성, 이식성
정형 데이터 품질 기준 - 완전성, 유일성, 유효성, 일관성, 정확성
분석목표정의서 - 원천데이터 조사, 분석 방안 및 적용 가능성 판단, 성과평가기준
일치성은 표본 크기가 증가할 수록 좋은 추정값을 제시
사분위 편차
평균 96.8 S= 6.72
위상적 공간 데이터 - 공간 객체 간의 관계를 표현하며, 방위, 공간 객체 간의 중첩
피어슨 상관계수
선형 상관계수
이론적으로 무한번 시행하면 시행하면 수학적 확률로 수렴
기각역
임계치 : 유의수준 a에서 귀무가설의 채택과 기각에 관련
다중회귀분석시 오차항은 상관이 없다 공분산은 0
앙상블 여러 약한 모델을 결합하여 최적화 모데을 만드는 방식
회귀 분석시 잔차들의 분산이 일정하며 1일 필요는 없다.
랜덤 포레스트는 투표를 통해서
회귀분석에서 독립변수들 간에 강한 상관관계 다중공선성 문제
비모수 많은 표본을 추출하기 어려운 경우 사용
자기회귀모형에 대한 설명 - 일정 시점전으 ㅣ자료가 현재 자료에 영향을 준다는 가정하에 만듬
분석모형 선정에는 분석모델 개발과는 상관 없음
분석모델 시각화 KNN - qlrytlrkrghkrlqjq
군집분석의 주요 평가 지표가 아닌 것은 군집의 평균
딥러닝 모델 분석 결과 해석시 사용하는 오차율은 상대오자
분석모델 시각화에서 회귀분석모델에서 사용안하는 것은 공간시각화
CRISP-DM 방법론 전개단계에서 분석모델 평가는 평가단계
값 분포에 적합하지 않은 것은 평행좌표계
확률적 경사하강법에 속도개념으로 가속화한 것은 모멘텀
데이터 시각화 산점도는 두변수 사이의 관계를 표시
손실함수 최소가 되는 가중치 값인 중심점을 찾아 큰 가중치를 제한하는데 람다로 규제의 강도를 강하게 하면 가중치 값이 0에 가까웢ㅁ
'Programming' 카테고리의 다른 글
ChatGPT 활용 데이터분석하기 (0) | 2024.09.10 |
---|---|
빅데이터 분석기사 기출 정리본 (2) | 2024.09.04 |
오라클 클라우드 프리티어 무료 서버 사용하기 (1) | 2024.08.28 |
github 장애 발생 - No server is currently available to service your request. (0) | 2024.08.15 |
아파치 SSL 인증서 갱신 방법 (0) | 2024.06.18 |