본문 바로가기

빅데이터분석기사 강의3

[빅데이터분석기사_실기] 2. 결측치 대체 안녕하세요, 여러분. 지난 시간 다뤄본 결측치 확인과 삭제 방법은 잘 보고 오셨죠? 이번에는 결측치를 대치하는 방법에 대해서 학습하겠습니다. 다음 시간 기출문제를 풀어보기 위해서 반드시 알아두셔야 합니다. 만약 R 기초를 아예 모르시는 분들은 블로그에 온라인 강의가 있으니 듣고 오시면 좋을 것 같습니다. :-) 1) 결측값 처리 방법 - 평균 대치법(Mean Imputation) 평균 대치법이란 결측값을 데이터의 평균, 중위수 등으로 대체하는 방법입니다. 대체하는 방법 중 가장 많이 쓰이는 방법입니다. 두 가지 방식으로 대치하겠습니다. 사용된 데이터는 R 내장 데이터인 airquality입니다. Ozone 변수와 Solar.R 변수에 각각 결측치가 있는 것을 확인할 수 있습니다. ifelse 조건문을 활.. 2021. 11. 11.
[빅데이터분석기사_실기] 1. 결측치 처리 데이터 전처리에서 결측치를 확인하고 처리하는 과정은 기본 중 기본입니다. 빅데이터분석기사 실기 시험에 실제 결측치 처리(단순 대치법)문제가 나왔습니다. 공부해봅시다 ! ! :-) 1) 결측치란? -결측치는 관측되지 않은 값으로서 NA(Not Available)로 표시됩니다. -데이터에 결측치가 포함되어 있으면 산술연산과 같은 데이터 분석을 제대로 할 수 없습니다. 2) 결측치 데이터 처리 순서 (***) -결측치 확인 -결측치 처리 방법 결정 (삭제 or 대치) -결측치 삭제 -결측치 대체 결측치 처리 순서 잘 보셨나요? 이 순서대로 R로 학습하도록 하겠습니다. -필요한 데이터 세트 : airquality(내장 데이터) , 생성 데이터 -필요한 패키지 : dplyr 1. 결측치 확인 is.na(x) 데이.. 2021. 11. 10.
빅데이터분석기사 실기 대비 강의 및 자료 안녕하세요, 여러분 ◡̈ 요즘 가장 핫한 기사 자격증인 빅데이터분석기사 잘 알고 계신가요 〰️ ? 올해 첫 시행된 시험이라 참고 자료도 많이 없고 특히 비전공자분들은 준비하시기 막막하실 것 같아서 제가 조금 도움을 드리고자 문제풀이를 진행하려고 합니다. 실기부터 시작하려고해요. R기본 강의부터 심화, 기출문제 풀이까지 차근차근 자료를 올리고 있습니다. 필요하신 분들은 아래 저의 빅데이터 블로그에서 참고하시면 될 것 같아요. https://everydatamaster.tistory.com/ BIGDATA) EVERYONE, EVERYTIME, EVERYWHERE 빅데이터 분석, 누구나 시작할 수 있습니다. 함께 열정적으로 세상을 읽어 나갈 수 있는 사람들에게는 언제나 열려 있는 빅데이터 학습 공간입니다. .. 2021. 11. 7.