TIL 29

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 5주차 1일. 데이터 분석 : 이변량 분석(2)

목차1. 이변량 분석 : 범주 → 범주2. 이변량 분석 : 숫자 → 범주 1차 미프도 잘 끝나고, AICE Associate도 그럭저럭 쳤고! 바쁘던 저번주가 끝나자마자 코딩마스터스 마감과 2차 미프가 스멀스멀 다가오는 이번 주. 주말도 에이블 기자단 활동하랴, DX 10반 소식지 만들랴 정신 없이 지나갔다. 마지막 제자들 수능이랑 면접도 얼마 안 남았고 말이지 ㅎㅎ 진짜 힘내자. 10월의 나. 그래도 잡념이 잘 안 든다는 점에서 이정도 바쁜 게 딱 좋은 걸지도 모르겠다. 그럼 데이터 분석 마지막 수업이었던 오늘도,복습 드가자잇          이변량 분석 : 범주 → 범주 범주 → 범주 이변량 분석 방법론시각화교차표, mosaic, stacked bar plot수치화카이제곱검정  범주 feature로 ..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 4주차 5일. 데이터 분석 : 이변량 분석(1)

목차1. 이변량 분석 : 수치 → 수치2. 이변량 분석 : 범주 → 수치3. 평균과 분산에 대하여 내일 AICE. 급하다. 빠르게 가자.    이변량 분석 : 수치 → 수치 지난 시간에 가설에 대해 배웠다. 이변량 분석은 결국 x가 y에 영향을 끼치는지를 보는 가설 검정 과정이라고 할 수 있겠지. 데이터사이언스가 늘 그렇듯이 자료의 타입(범주형/수치형)에 따라 분석 방법이 다르다. 그중 첫번째. x도 수치고 y도 수치인 경우를 보자.  이변량 분석은 일반적으로 시각화와 수치화를 통해 진행된다. 수치 → 수치 이변량 분석 방법론시각화scatterplot, regplot, jointplot, pairplot, heatmap수치화상관계수, 상관분석    시각화1. scatterplot  산점도. 하나의 row..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 4주차 3일. 휴가, 그리고 AICE

미니프로젝트가 끝나고 첫 수업. 에서 휴가를 쓴 나 미니프로젝트 동안 느꼈던 많은 부족함도 있고, 특히 시각화 부분은 많이 다듬어야겠다고 생각했다. 사흘 뒤면 AICE 시험도 있고, 이제 집 밖에 나갈 일정은 한동안 없으니 신나게 키보드 두드려야지. 오늘 휴가를 쓰긴 했는데, 생각보다 일찍 돌아온 탓에 미프 자료로 이것저것 끄적거려봤다. 따라서 오늘은 미니프로젝트 데이터 추가탐색을 해 보겠다.  미니프로젝트 데이터 추가 탐색 미프 후기는 따로 쓰겠지만, 미니프로젝트에서는 1일차에 구매자 분석을 통한 이탈률 예측,2일차에 토익 점수 예측을 주제로 데이터 전처리, 탐색을 진행했다. 그 중에 오늘 좀 더 만져본 건 토익 점수 예측 데이터다. 사실 구매자 분석이 좀 더 하고 싶었는데, 나는 그것도 할 시간이 될..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 3주차 2일. 데이터 다듬기 - 데이터프레임 변경(2)

목차 - 데이터프레임 합치기 : pd.concat(), pd.merge() - 데이터프레임 세부 조정 : rolling(), shift(), pivot(), melt()  본격적인 가을을 앞두고 마지막 pandas 수업이 끝났다. 코딩마스터스도 40문제 정도 풀었고, 다음주면 드디어 첫 미니프로젝트. 그리고 다음주 토요일은 AICE Associate 시험까지. 바빠서 힘들기도 하고, 신나기도 하는 요즘이다. 집이 점점 개판이 돼 간다 추석동안 못 했던 스터디들이 몰려 좀 많이 늦은 시간이 되었지만, 한번 가 보자.    데이터프레임 합치기 저번 AICE에서 나에게 공포를 선사했던 concat()과 merge() 되시겠다. 아무래도 흔히 보는 xlsx 파일은 시트 하나하나가 데이터프레임이고,데이터베이스 무..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 3주차 1일. 데이터 다듬기 - 데이터프레임 변경

목차 - 열 변경 : rename(), drop(), map(), replace() - 결측치 처리 : isna(), dropna(), fillna(), ffill(), bfill(), interpolate() - 범주값 처리 : cut(), qcut(), one-hot encoding  연휴가 끝나고 돌아온 TIL. 오늘은 데이터프레임의 열 이름 변경, 생성, 삭제와 범주값 변경, 생성 그리고 결측치 및 가변수의 처리를 배웠다. 나날이 배우는 것도 많아진다만, 다음 주에 있을 AICE에 응시하는 객기를 부린 고로 오늘도 힘 내 보자.   열 변경 데이터프레임을 다루다 보면 열을 변경할 일이 많다. AICE에서 가장 먼저 요구하는 사항 역시 이 부분이니만큼 데이터 전처리의 첫단계라 할 수 있겠다.  re..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 2주차 5일. 데이터 다듬기 - pandas DataFrame 조회 / DataFrame 집계

목차 1) 데이터프레임 조회 - loc()과 iloc() 2) 데이터프레임 집계 - gruopby() 3) 집계함수   쏜살같이 흘러간 교육 2주차. 추석 연휴를 앞둔 마지막 시간이니만큼 많은 것들을 배웠다. 저번에 데이터를 요리조리 뜯어보는 과정을 배웠다면,이번에는 데이터에서 의미를 도출할 때 필요한 도구들을 배웠단 느낌이다.비슷해 보이지만 아무튼 다르다. 오늘 과정의 핵심을 요약하자면 .loc[]과 .groupby()를 들 수 있겠다. 따라서 오늘의 포스팅은 이 둘을 중심으로 진행되겠다. 강사님께서 마지막에 matplotlib.pyplot을 이용한 시각화도 다뤄 주셨는데,그래프 색깔 바꾸면서 노느라 나중에 다시 나올 내용이라고 하셔서 온전히 집중하진 못한 것 같다.    데이터프레임 조회 : loc[..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 2주차 2일. 함수

오늘은 목차 없다. 처음부터 끝까지 함수다. 함수(Function, 函數). 중학생 시절 수학선생님께서 함수의 함이 상자(서랍함 할때 그 함)라고 알려 주셨었다. 지금 생각해 보면 뼈문과인 나에게 참 적절한 설명이었다고 생각한다. 어떤 입력값(input)이 마술상자(함)에 들어갔다 뿅 바뀌어서 나오는거지(output). 결국 함수 선언이란 그 마술상자 안의 구조를 만드는 거고. 정확한 인식인지는 모르겠지만, 이때문에 나에게 함수는어떤 동작을 실행하는 객체(object)에 가깝다. 메서드는 동작 그 자체, 함수는 어떤 동작을 시키는 애. 함수와 return 함수는 기본적으로 처리를 하지, 반환을 하지는 않는다. 상자에 배출 기능은 없는 것이다. 그래서 배출 기능(반환)을 달아줘야 하는데, 그게 return..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 2주차 1일(2). while 문과 제어문 심화

목차1. while 문2. 제어문 심화 시간이 모자랐던 어제, 밀린 TIL을 마무리해본다. 이미 TIL에서 Today는 물건너갔다. while 문 정해진 조건에 해당하지 않게 될 때까지 반복적으로 수행한다. 반복시킨다는 점에서는 for문과 비슷하지만 일반적으로 사용법이 다르다고 한다. 각자가 동작하는 원리를 보면 for 문 : iterabel한 자료형의 요소들을 하나씩 훑으며 시행한다.while 문 : 특정 조건을 충족하는 한 무한히 수행한다. 이런 차이가 있는데, 따라서 for문은 list, dict등을 채우거나,해당 자료의 요소마다 연산을 시행할 때 쓴다. 하지만 while문은 심플하게 동작을 반복한다. 강사님 설명으로는 while문이 잘 안 쓰인다던데,for문으로 대체가능해서 그런 걸까...? 여튼..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 2주차 1일. 제어문 - if, for, while 문

목차1. if 문2. for 문 힘차게 밝은 에이블스쿨 2주차 첫날. 1주차까지는 어찌어찌 넘어왔다만,2주차부터는 나같은 문돌이를 시험에 들게 하는 내용들이 나온다. 그래도 따라가지긴 하는 거 보면,AICE 떨어지면서 뭐라도 남았나보다. 전화위복일세. 여튼 그래서 시작해 보는 TIL(Today I Learned) 포스팅. 오늘의 메뉴는 제어문이다.   if 문 말 그대로 조건문이다. 특정 조건에 맞는 경우에 코드를 실행하고,아닌 경우에 넘어가거나, 다른 조건을 걸거나 한다. 기본형, else형, elif - else형으로 나눌 수 있다.  기본형 if 문# 변수 선언my_score = 73# 80보다 크거나 같으면 10 더하기if my_score >= 80: my_score +- 10# 결과 출력p..