NumPy 2

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 3주차 1일. 데이터 다듬기 - 데이터프레임 변경

목차 - 열 변경 : rename(), drop(), map(), replace() - 결측치 처리 : isna(), dropna(), fillna(), ffill(), bfill(), interpolate() - 범주값 처리 : cut(), qcut(), one-hot encoding  연휴가 끝나고 돌아온 TIL. 오늘은 데이터프레임의 열 이름 변경, 생성, 삭제와 범주값 변경, 생성 그리고 결측치 및 가변수의 처리를 배웠다. 나날이 배우는 것도 많아진다만, 다음 주에 있을 AICE에 응시하는 객기를 부린 고로 오늘도 힘 내 보자.   열 변경 데이터프레임을 다루다 보면 열을 변경할 일이 많다. AICE에서 가장 먼저 요구하는 사항 역시 이 부분이니만큼 데이터 전처리의 첫단계라 할 수 있겠다.  re..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 2주차 4일. 데이터 다듬기 - numpy 기초, pandas DataFrame 생성 및 탐색

목차 1) numpy 기초 2) pandas DataFrame의 구조와 기능  파이썬 문법을 배우던 데이터 다루기 강의가 끝나고, 데이터 다듬기로 넘어왔다. 데이터 다듬기부터는 실제 데이터테이블(보통 수백 개 이상의 데이터가 있다.)을 다루게 되며,이를 다루기 위해 정보처리 라이브러리 numpy와 pandas, 시각화 라이브러리 matplotlib과 seaborn을 쓴다. 오늘은 numpy의 배열(array)과 pandas의 Series, DataFrame에 대해 배우고,이를 다루기 위해 DataFrame의 속성과 pandas 함수에 대해 알아보자.   numpy 기초 numpy는 본질적으로 수학적 처리를 위한 라이브러리이다. 강사님께서는 데이터분석 측면에서 기반이 된다는 정도만 알고 있으면 된다셨다. ..