[빅데이터 탐색]
횡적자료: 단일시점 여러대상 | 종적자료: + 시계열 ======> 여러시점표현 질적자료: 서열(만족도),명목 | 양적자료: 비율(절대0),등간 데이터 정제: 불완전 데이터를 검출/이동/정정 or 교정 1) 수집: 전처리 2) 변환 3) 교정 4) 통합 결측치: 입력누락/ 비어있는 값 완전무작위(MCAR): 다른 변수와 연관X, 완전랜덤 무작위(MAR): 특정변수가 영향주지만 결과와 상관X | 결과에는 상관 없어야함 비무작위(MNAR): 다른 변수와 상관 있음 | 결과에 영향준다 결측치처리 단순대치 단순삭제: MCAR의 경우 1) listwise(데이터가 작은경우 표본감소문제) 2) pairwise 평균대치: 비조건부/조건부 단순확률핫덱: 연구자료에서 표본바탕의 비슷한 규칙찾아 대체 다중대치: 단순대치 ..
2023.10.31