데이터분석 5

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 6주차 4일. 데이터 분석 표현(2). streamlit으로 차트 그리기, folium map 사용하기.

지난 포스팅에 이어지는 내용. [streamlit의 이해, streamlit 메서드]https://guoyee94.tistory.com/36 이번에는 streamlit으로 차트 그리는 법과 folium map을 알아보자.         streamlit으로 차트 그리기 streamlit은 강력한 차트 기능을 지원한다. 분석가 입장에서는 비분석가에게 정보를 제공하기 위해 사용하게 되는 만큼,시각화에 힘이 빡 들어간 프레임워크이기 때문이다. streamlit을 활용해서 차트를 그리는 방법은 세 가지가 있다. 1. Simple Chart  - Streamlit에 내장되어 있음, 따로 import 불필요  - st.line_chart(df) / st.bar_chart(df) / st.area_chart(df) ..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 6주차 4일. 데이터 분석 표현(1). streamlit 이해, streamlit 메서드

특히 뒤풀이가 폭풍같이 지나가버린 2차 미니프로젝트. 지금 안건데 지난주 후기를 안썼더라. 숙제가 늘어나는 기분. 어쨌든 미니프로젝트 후기는 이번 주말에 쓰기로 하고,이번주 목-금은 '허신' 강사님께 '데이터 분석 표현'이란 걸 배운다. 월화수목금2차 미니프로젝트한글날데이터 분석 표현  Jupyter Notebook 환경을 벗어나,실무에선 시각화 및 인터페이스 재현을 이렇게 진행하는건가...? 를 맛볼 수 있는 시간이었던 것 같다.        Streamlit의 이해  Streamlit은 파이썬으로 쉽게 데이터 애플리케이션을 만들 수 있게 해주는 오픈소스 프레임워크이다. 복잡한 웹 개발 지식 없이도 간단한 코드로 대화형 웹 애플리케이션을 개발할 수 있으며, 특히 데이터 분석, 머신러닝 모델 시각화 및 ..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 5주차 1일. 데이터 분석 : 이변량 분석(2)

목차1. 이변량 분석 : 범주 → 범주2. 이변량 분석 : 숫자 → 범주 1차 미프도 잘 끝나고, AICE Associate도 그럭저럭 쳤고! 바쁘던 저번주가 끝나자마자 코딩마스터스 마감과 2차 미프가 스멀스멀 다가오는 이번 주. 주말도 에이블 기자단 활동하랴, DX 10반 소식지 만들랴 정신 없이 지나갔다. 마지막 제자들 수능이랑 면접도 얼마 안 남았고 말이지 ㅎㅎ 진짜 힘내자. 10월의 나. 그래도 잡념이 잘 안 든다는 점에서 이정도 바쁜 게 딱 좋은 걸지도 모르겠다. 그럼 데이터 분석 마지막 수업이었던 오늘도,복습 드가자잇          이변량 분석 : 범주 → 범주 범주 → 범주 이변량 분석 방법론시각화교차표, mosaic, stacked bar plot수치화카이제곱검정  범주 feature로 ..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 4주차 4일. 데이터 분석 : 단변량 분석

목차1. 데이터 분석 개요2. 일변량 데이터 분석 : 수치형3. 일변량 데이터 분석 : 범주형4. 가설 검정 새로운 강사님이 오시는 첫 날을 휴가로 보내고,홀로 초면인 한기영 강사님을 뵌 나. 이전 이장래 강사님과는 약간 다른 스타일이신데, 원리에 굉장히 많은 시간을 할애하신다. 뚝딱뚝딱 코드 치는 거에도 익숙해졌다 싶었는데,또 이런 강의를 들으니 낯설기도 어렵기도 하다. 내가 뭘 할 수 있니열심히 요약해야지, 어제 안 한 부분까지 해서 싹 훑어보자.  데이터분석 개요 데이터분석, DX 컨설턴트의 주 업무 중 하나이자, 지금까지 달려 온 이유. 데이터의 종류(수치형/범주형)에 따른 적절한 분석 방법을 익혀비즈니스에 도움이 되는 인사이트를 도출하는 것이 목적이다.  CRISP-DM   CRISP-DM크리스..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 2주차 4일. 데이터 다듬기 - numpy 기초, pandas DataFrame 생성 및 탐색

목차 1) numpy 기초 2) pandas DataFrame의 구조와 기능  파이썬 문법을 배우던 데이터 다루기 강의가 끝나고, 데이터 다듬기로 넘어왔다. 데이터 다듬기부터는 실제 데이터테이블(보통 수백 개 이상의 데이터가 있다.)을 다루게 되며,이를 다루기 위해 정보처리 라이브러리 numpy와 pandas, 시각화 라이브러리 matplotlib과 seaborn을 쓴다. 오늘은 numpy의 배열(array)과 pandas의 Series, DataFrame에 대해 배우고,이를 다루기 위해 DataFrame의 속성과 pandas 함수에 대해 알아보자.   numpy 기초 numpy는 본질적으로 수학적 처리를 위한 라이브러리이다. 강사님께서는 데이터분석 측면에서 기반이 된다는 정도만 알고 있으면 된다셨다. ..