전체 글 71

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 5주차 1일. 데이터 분석 : 이변량 분석(2)

목차1. 이변량 분석 : 범주 → 범주2. 이변량 분석 : 숫자 → 범주 1차 미프도 잘 끝나고, AICE Associate도 그럭저럭 쳤고! 바쁘던 저번주가 끝나자마자 코딩마스터스 마감과 2차 미프가 스멀스멀 다가오는 이번 주. 주말도 에이블 기자단 활동하랴, DX 10반 소식지 만들랴 정신 없이 지나갔다. 마지막 제자들 수능이랑 면접도 얼마 안 남았고 말이지 ㅎㅎ 진짜 힘내자. 10월의 나. 그래도 잡념이 잘 안 든다는 점에서 이정도 바쁜 게 딱 좋은 걸지도 모르겠다. 그럼 데이터 분석 마지막 수업이었던 오늘도,복습 드가자잇          이변량 분석 : 범주 → 범주 범주 → 범주 이변량 분석 방법론시각화교차표, mosaic, stacked bar plot수치화카이제곱검정  범주 feature로 ..

[KT AIVLE School][에이블기자단] KT 에이블스쿨 6기(DX 트랙) 4주차 후기. 1차 미니프로젝트 / 데이터 분석

오프닝데이 이래 가장 바빴던 한 주. 미니프로젝트랑 데이터 분석 이야기 뿐이다만,그만큼 밀도(?)있는 경험이었다..월화수목금미니프로젝트 1차데이터 분석     1차 미니프로젝트 미니프로젝트. 이름과 다르게 임팩트가 꽤 컸다. 애초에 대학원(인문계열) - 학원 출신인 나에게 '프로젝트'는 너무나 먼 단어였기에...    미니프로젝트는 이틀 간 진행되고, 첫날과 둘째 날 별개의 과제를 받아조원들과 함께 해결하는 것이 목표다. 그렇게 긴장을 가지고 받은 첫 미니프로젝트 과제,   고객 데이터를 바탕으로 이탈 고객을 미리 예측하고,이에 적합한 이탈 방지 프로모션을 제안하라.  ...같은 멋들어진 건 아니고, 아직 그럴 짬이 못 된다.위의 상황에서 전처리에 해당하는 구간을 진행하고 코드를 리뷰하는 것이었다. Cu..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 4주차 5일. 데이터 분석 : 이변량 분석(1)

목차1. 이변량 분석 : 수치 → 수치2. 이변량 분석 : 범주 → 수치3. 평균과 분산에 대하여 내일 AICE. 급하다. 빠르게 가자.    이변량 분석 : 수치 → 수치 지난 시간에 가설에 대해 배웠다. 이변량 분석은 결국 x가 y에 영향을 끼치는지를 보는 가설 검정 과정이라고 할 수 있겠지. 데이터사이언스가 늘 그렇듯이 자료의 타입(범주형/수치형)에 따라 분석 방법이 다르다. 그중 첫번째. x도 수치고 y도 수치인 경우를 보자.  이변량 분석은 일반적으로 시각화와 수치화를 통해 진행된다. 수치 → 수치 이변량 분석 방법론시각화scatterplot, regplot, jointplot, pairplot, heatmap수치화상관계수, 상관분석    시각화1. scatterplot  산점도. 하나의 row..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 4주차 4일. 데이터 분석 : 단변량 분석

목차1. 데이터 분석 개요2. 일변량 데이터 분석 : 수치형3. 일변량 데이터 분석 : 범주형4. 가설 검정 새로운 강사님이 오시는 첫 날을 휴가로 보내고,홀로 초면인 한기영 강사님을 뵌 나. 이전 이장래 강사님과는 약간 다른 스타일이신데, 원리에 굉장히 많은 시간을 할애하신다. 뚝딱뚝딱 코드 치는 거에도 익숙해졌다 싶었는데,또 이런 강의를 들으니 낯설기도 어렵기도 하다. 내가 뭘 할 수 있니열심히 요약해야지, 어제 안 한 부분까지 해서 싹 훑어보자.  데이터분석 개요 데이터분석, DX 컨설턴트의 주 업무 중 하나이자, 지금까지 달려 온 이유. 데이터의 종류(수치형/범주형)에 따른 적절한 분석 방법을 익혀비즈니스에 도움이 되는 인사이트를 도출하는 것이 목적이다.  CRISP-DM   CRISP-DM크리스..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 4주차 3일. 휴가, 그리고 AICE

미니프로젝트가 끝나고 첫 수업. 에서 휴가를 쓴 나 미니프로젝트 동안 느꼈던 많은 부족함도 있고, 특히 시각화 부분은 많이 다듬어야겠다고 생각했다. 사흘 뒤면 AICE 시험도 있고, 이제 집 밖에 나갈 일정은 한동안 없으니 신나게 키보드 두드려야지. 오늘 휴가를 쓰긴 했는데, 생각보다 일찍 돌아온 탓에 미프 자료로 이것저것 끄적거려봤다. 따라서 오늘은 미니프로젝트 데이터 추가탐색을 해 보겠다.  미니프로젝트 데이터 추가 탐색 미프 후기는 따로 쓰겠지만, 미니프로젝트에서는 1일차에 구매자 분석을 통한 이탈률 예측,2일차에 토익 점수 예측을 주제로 데이터 전처리, 탐색을 진행했다. 그 중에 오늘 좀 더 만져본 건 토익 점수 예측 데이터다. 사실 구매자 분석이 좀 더 하고 싶었는데, 나는 그것도 할 시간이 될..

[KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 3주차 후기. 데이터프레임 변경 / 반장·기자단 / 코딩마스터스

늦었다. 낯설고 어렵기만 하던 에이블스쿨도 어느새 3주차에 접어들었다. 다음주면 미니프로젝트가 시작되는데...... 긴장된다 긴장돼. 진도로는 pandas 데이터프레임 전처리까지 끝났고,코딩마스터스도 한창 진행중, 내부적으로는 반장, 기자단에 스토리텔러까지 뽑은 한 주였다. 자 그럼 3주차 후기 가보자.     3주차 핵심 내용  이번 주는 추석이 껴 있어서 짧았다. 오랜만에 본가에 가서 친구들도 보고 흑역사도 하나 썼다. 노트북을 챙겨 가서 코딩마스터스 문제도 많이 풀었다. 거의... 문제에 얻어맞은 거지만. 그래도 동생(현직 개발자) 한테 디버깅하는 법도 배우고 나름 의미있게 쓴 것 같다. 여튼... 고작 이틀간만 진행됐음에도 불구하고 엄청 많은 것들을 배웠다. 3주차에 배운 것- 열 변경 : ren..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 3주차 2일. 데이터 다듬기 - 데이터프레임 변경(2)

목차 - 데이터프레임 합치기 : pd.concat(), pd.merge() - 데이터프레임 세부 조정 : rolling(), shift(), pivot(), melt()  본격적인 가을을 앞두고 마지막 pandas 수업이 끝났다. 코딩마스터스도 40문제 정도 풀었고, 다음주면 드디어 첫 미니프로젝트. 그리고 다음주 토요일은 AICE Associate 시험까지. 바빠서 힘들기도 하고, 신나기도 하는 요즘이다. 집이 점점 개판이 돼 간다 추석동안 못 했던 스터디들이 몰려 좀 많이 늦은 시간이 되었지만, 한번 가 보자.    데이터프레임 합치기 저번 AICE에서 나에게 공포를 선사했던 concat()과 merge() 되시겠다. 아무래도 흔히 보는 xlsx 파일은 시트 하나하나가 데이터프레임이고,데이터베이스 무..