직장인 대학원/캐글 스터디3 캐글 스터디 2회차 - EDA(탐색적 데이터 분석) 오늘은 데이터 분석의 기본 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 에 대해 스터디한 내용을 정리해보려고 해요.단순히 그래프 몇 개 그리는 게 아니라, 데이터의 상태를 꼼꼼히 점검하고, 인사이트를 얻는 과정이라는 걸 다시 한 번 느꼈습니다. 1. Basic Analysis 코드 정리데이터를 받으면 가장 먼저 실행하는 기본 코드들! 아래 코드들은 판다스 DataFrame을 기준으로 설명합니다.df_train.head() # 상위 5개 행 출력df_train.tail() # 하위 5개 행 출력df_train.shape # (행 개수, 열 개수) 출력df_train.info() # 각 열의 데이터 타입과 결측.. 직장인 대학원/캐글 스터디 2025. 5. 19. 캐글 스터디 1회차 - 과제 1회차 과제Basic Analysis 실습 해오기. Basic Analysis데이터 셋 크기 (행/열): 데이터의 전체 구조를 파악한다.실제 모습: head()나 sample()로 데이터를 직접 확인한다.중복치: 중복된 행이 있는지 확인한다.결측치: 누락된 값이 있는지 파악한다.기술 통계: 수치형 변수의 평균, 분산 등 기본 통계값을 확인한다.컬럼 종류: 수치형/범주형 등의 변수 타입을 구분한다.범주형 컬럼의 고유값: 각 범주형 변수에 어떤 값들이 있는지 파악한다. 코드로 구현하기데이터 불러오기# 데이터 불러오기train = pd.read_csv('/kaggle/input/playground-series-s5e3/train.csv')test = pd.read_csv('/kaggle/input/playgr.. 직장인 대학원/캐글 스터디 2025. 4. 14. 캐글 스터디 1회차 - 캐글이란 .. 오늘 목차노트북 작성하는 방법분석 순서 및 내용다음시간 예고 캐글에서 분석을 진행하기 위해 노트북을 어떻게 사용하는지 학습했다. Playground 에서 연습을 할 예정이다.우리는 아래 링크의 대회를 연습할 예정이다.https://www.kaggle.com/competitions/playground-series-s5e3/code Binary Prediction with a Rainfall DatasetPlayground Series - Season 5, Episode 3www.kaggle.com 데이터셋이 작아서 빠르게 결과 확인이 가능하다. 분석 순서 및 내용Basic Analysis데이터 셋 크기 (행/열): 데이터의 전체 구조를 파악한다.실제 모습: head()나 sample()로 데이터를 직접 .. 직장인 대학원/캐글 스터디 2025. 4. 7. 이전 1 다음