subindev 님의 블로그

[필기] 빅데이터 분석기사 필기 요약정리(pdf 파일 첨부) 본문

데이터 관련/빅데이터 분석기사

[필기] 빅데이터 분석기사 필기 요약정리(pdf 파일 첨부)

subindev 2025. 6. 14. 18:15

 

(2025년 04월 빅분기 필기 기준 - 7일 정도 공부하여 합격하였습니다)

간단한 후기를 남기자면, 양이 정말 많아 지엽적인 것까지 암기하려고하면 시간이 너무 많이 걸릴 것 같습니다.

저도 세세한 것까지 보고 암기하진 못하였고, 기본기는 최대한 외우고 들어갔습니다.

위 파일을 반복적으로 읽으며 눈에 익히기는 했으나 암기할 시간이 없었어요.

세세한 내용을 확실히 암기하기 보단 전반적인 기본기가 있으면 합격할 수 있다고 생각합니다.

 

여기서 말한 기본기가 무엇인지를 설명하기 위해 예를 들어보겠습니다!

아래 표는 파일 내용 중 일부입니다.

분석기법들이 어떤 데이터 형식을 input으로 받고 output은 어떤 걸 내보내냐는 꼭 암기하고 들어갔습니다.

 독립변수로 어떤 데이터 형태를 가지는지 종속변수로는 어떤 데이터 형식을 가지는지 는 암기하였습니다.

 

물론 어려운 보기도 함께 있지만 정답을 가려낼 때엔 기본기만으로 충분히 가려낼 수 있었습니다.

 예 ) 로지스틱 회귀는 종속 변수가 연속형일 때 사용할 수 있다 (X) - 종속변수 : 범주형

        CNN 신경망 기법은 독립변수가 범주형일 때만 사용할 수 있다 (X) - 모든 형태 가능

 

 

📘 자료 형태에 따른 분석 방법

분석기법 언제 사용하나요? 데이터 형태
(독립 / 종속)
설명
선형회귀 수치 예측 연속형 / 연속형 키 → 몸무게 예측 등
로지스틱 회귀 분류 연속형 / 범주형 시험점수로 합격여부 예측
분산분석 (ANOVA) 그룹 간 평균 비교 범주형 / 연속형 성별 → 수학점수 평균 차이
카이제곱 검정 범주형 간 독립성 검정 범주형 / 범주형 성별 vs 흡연유무
교차분석 범주형 간 관계 파악 범주형 / 범주형 직업군 vs 구매여부
빈도분석 범주형 변수의 빈도 확인 범주형 / (없음) 고객 유형별 인원수
요인분석 변수 축소 (데이터 축약) 여러 변수 → 요인 설문 문항 → 공통된 요인 추출
주성분분석(PCA) 차원 축소 수치형 변수들 시각화, 군집분석 전 데이터 압축
군집분석 유사 그룹 찾기 비지도 학습 고객 세분화
연관분석 장바구니 분석 항목 간 관계 우유 사면 빵도 산다
의사결정나무 분류 & 회귀 범주형/연속형 / 범주형/연속형 IF-THEN 규칙 기반
신경망(DNN, CNN, RNN) 복잡한 예측 문제 모든 형태 가능 이미지, 시계열, 텍스트
SVM 고차원 분류 연속형 / 범주형 경계 기준 분류
시계열분석 (ARIMA 등) 시간 데이터 예측 시간 / 연속형 매출 예측, 주가 예측
베이지안 분석 사전 확률 + 데이터 → 사후확률 다양한 경우 스팸 필터, 질병 확률

 

 

💡 변수 형태로 분석기법 빠르게 고르는 팁

독립 변수 종속 변수 분석 방법
연속형 연속형 선형회귀
연속형 범주형 로지스틱 회귀분석
범주형 연속형 분산분석(ANOVA)
범주형 범주형 교차분석, 로지스틱 회귀, 카이제곱
시계열 연속형 시계열분석(ARIMA 등)

 

 

빅분기 필기 요약정리
빅분기_필기_요약정리.pdf
4.35MB

 

 

+) 블로그와 교재, ChatGPT를 참고하여 만든 개인적인 자료입니다. 혹시 문제가 된다면 댓글 남겨주시면 감사하겠습니다.

 

 

다들 오늘도 화이팅 하시길 바랍니다 : )