[빅분기](9)
-
[빅분기 필기 합격후기]
참고 ) 저는 통계학과 재학생입니다! :) 대기줄.. 막 700번대.. 였즘... 예상점수보다 많이 잘나온 걸 보니 찍은 게 맞았나보다! 시험일정: 9/23(토) 오전 10시 시험장소: 도선고등학교(성동구) 공부시작일: 9/11 책: 2024 이기적 빅분기 필기 기본서 2024 이기적 빅데이터분석기사 필기 기본서 | 나홍석 - 교보문고 2024 이기적 빅데이터분석기사 필기 기본서 | product.kyobobook.co.kr 2023 이기적 빅분기 필기 기본서도 있는데 갠적으로는 2024가 뭔가 업데이트 돼있을 것만 같은 느낌이 들어서 구매! 서사 9/15에 블로그 시작했는데, 시작한 이유가 공부를 너무너무 안해서 그렇습니다! 9월부터 현재까지 9-6 인턴생활을 하고 있는데요! 사실 출퇴근시간..
2023.10.31 -
[모의고사 2회차/오답노트]
정성적 데이터: 함축적 의미내포/주관저내용/비정형데이터!! 정성(비정형)/ 정량(정형,반정형) 암무지와 형식지: 형식치는 표출화를 통해 구체화되어 외부로 표현됨 OlTP(데이터를 수시로 갱신)/OLAP(비즈니스관점 의사결정 활용/분석) 빅데이터 특징: 단일데이터여도 가치가 큽니다!! 연관규칙분석: 변인들간 주목할만한 상관관계가 있는지 찾아내는 것!! 데이터권리시대: 마이데이터/보호와 통제/기업은 개인데이터 사용에 제약걸릴수도 그래서 고객접점 상실할수도~~ 데이터리터러시는 데이터분석시대이다!!! 빅데이터수집기술 로그수집기: 웹서버나 시스템의 로그수집하는 기술 센스네트워크 유비쿼터스형 컴퓨팅 구현을 위한 초경량 저전력의 센서로 구성된 유무선 네트워크임!!!! 크롤링: 분산저장된 문서 수집해서 검색대상의 색인..
2023.10.31 -
[모의고사 1회차/오답노트]
모의고사 1회차 오답노트 ETL: 데이터 추출/변환/적제 --> 다양한 원천데이터를 추출하고 공통된 형식으로 변환하여 적재하는 딥러닝: 딥러닝은 해석이 어려움/Dropout(과적합방지를 위해 학습과정에서 유닛의 일부를 랜덤_임의로 누락시킴)/sigmoid_functio을 활성함수로 이용/최적의 학습결과를 찾기위해 오류 역전파 알고리즘 사용 빅데이터 분석 방법론(5단계): 분석기획/데이터준비/데이터분석/시스템구현/평가 및 전개 지도학습: 학습데이터로부터 하나의 함수를 유추하기 위한 방법 (분류/회귀) 개인정보 비식별조치에 대한 익명성 검증방법 t-근접성: 전체데이터 집합의 정보분포와 특정 정보의 분포차를 t이하로 만듦 데이터 자체의 특성과 통계적 특성을 파악하고 시각화를 통해 데이터를 파악한다) 통찰: 분..
2023.10.31 -
[PART3 요약추가]
AI)머신러닝)딥러닝 딥러닝: 인공신경망에 기반한 머신러닝의 한 갈래/점진적으로 의미표현을 배우는 데 좋음/데이터로부터 표현을 학습하는 방식 비정형데이터 good/인지문제 잘 해결 음성,이미지인식,자연어처리,헬스케어 등의 분야 활용 인공신경망~심층신경망 심층신경망: DNN 합성곱신경망: CNN 순환신경망: RNN 생성적 거대신경망: GAN RBM 등 인공신경망(ANN): 뇌의 신경망에서 착안해서 구현한 컴퓨터 시스템의 총칭 연구 flow 1943: 단순패턴분류모형 개발 햅: 뉴런간의 연결강도 weight를 조정하여 학습규칙 개발 로젠블럿: 퍼셉트론(인공세포)개발 XOR문제(비선형성 한계점) 홉필드~: 역전파알고리즘을 활용해 다층의 퍼셉트론 개발 및 문제해결 구조: 입력/은닉/출력 은닉층이 여러개, 층마다..
2023.10.31 -
[빅데이터 모델링]
분석모형 구축 통계분석: 전형적인 데이터 모델 구축기법 회귀분석: 종속변수 값을 예측/인과성/독-종의 선형관계 로지스틱회귀분석: 개별 관측값의 분류 판별분석: 종속변인이 2이상의 그룹으로 이뤄졌을 때, 여러개의 독립변수로 관측값 예측 및 판별 주성분분석: 상관관계가 높은 변수의 선형결합으로 만들어진 주성분이라는 새로운 변수를 만들어 변수를 요약 및 축소 데이터 마이닝: 데이터를 다양한 관점에서 분석--> 패턴 및 상관성을 분석하여 insight 분류(로지스틱회귀/의사결정나무/K-NN/SVM) 예측(회귀/장바구니/시계열/K-NN) 연관(연관성/순차패턴분석) 군집화(군집분석/K-means클러스터링/ML) ex) SOM(Self Organinzing Maps) 머신러닝: 알고리즘으로 학습한 지식 추출 및 이를..
2023.10.31 -
[PART1/PART2 오답노트]
PART1 (오답노트) 맵리듀스 패턴 단어세기/그룹화/조인/필터링/인버트인덱스/최대-최소/통계 조인패턴: 두개 이상의 데이터 세트를 조인(연결)하여 처리하는데 사용 FTP(file transfer protocol): 정형데이터 수집기법 대량의 파일(데이터)를 네트워크를 통해 주고받을 때 사용되는 파일 전송 프로토콜, 동작 방식이 직관/단순하여 파일을 빠른속도로 한꺼번에 주고받을 수 있다. 파일 송수신을 목적으로 하고, 수집하는 기술X 네트워크를 통해 공유하는 여러호스트 컴퓨터의 데이터에 접근가능 분산파일시스템 네트워크를 통해 공유하는 여러호스트 파일에 접근하는 파일시스템 네트워크저장시스템 이기종 데이터저장장치를 하나의 데이터 서버에 연결하여 총괄적으로 데이터를 저장 및 관리하는 시스템 스쿱: 대용량 ..
2023.10.31