자격증 6

[ADsP] ADsP 요점정리 : Part 3. 통계 분석(3). 회귀분석

- 독립변수(x)가 종속변수(y)에 미치는 영향을 파악오차와 잔차의 차이 : 오차는 모집단 기준, 잔차는 표본집단 기준 - 회귀계수를 추정하는 방법 : 최소제곱법 잔차의 제곱합이 최소가 되는 회귀계수(a)와 절편(b)를 구하는 방법 - 회귀모형 평가 : R-square(모형으로 설명가능한 변동 / 총 변동)    ★ ★ ★ 선형성x와 y가 선형관계일 것등분산성잔차의 분산이 그르게 분포할 것정상성 = 정규성잔차가 정규분포의 특성을 가질 것Q-Q plot, 샤피로 윌그 검정, 히스토그램, 왜도/첨도 등으로 확인 가능독립성독립변수 간에는 상관관계가 없을 것   단순회귀하나의 독립변수만이 영향을 미침y = ax + b다중회귀독립변수가 둘 이상y = a1x1 + a2x2 + ... + anxn + b다항회귀독립변..

[ADsP] ADsP 요점정리 : Part 3. 통계 분석(2). 기초 통계분석

기술통계 : 표, 그림, 통계량 등으로 자료의 특성을 정리하는 것  ex) 줄기-잎 그림, 도넛차트, 히스토그램, 상자수염그림   산포도분산, 표준편차, 사분위수, 사분위수범위, 백분위수, 변동계수, 표본평균의 표준오차분포형태왜도(비대칭 정도) : 양수면 좌편향, 음수면 우편향, 0이면 대칭 왜도가 양수면 최빈값 왜도가 음수면  평균 첨도첨도 = 0 : 정규분포 정도로 뾰족함   줄기 - 잎 그림데이터를 줄기와 잎의 모양으로 그림자료를 높은 자리의 수와 낮은 자리의 수로 분할한 뒤 전자를 '줄기', 후자를 '잎'으로 칭함.   공분산은 분산의 곱이다. 분산은 평균으로부터 어느 방향으로, 얼마나 떨어져 있는가를 나타내는데,공분산이 음이면(= 두 분산의 부호가 다르면) 둘은 음의 상관관계,공분산이 양이면(=..

[ADsP] ADsP 요점정리 : Part 3. 통계 분석(1). 통계분석의 이해

ADsP의 꽃, Part 3. Part 3의 꽃, 통계분석. 분량이 다른 범위의 2~3배 정도 되는 것 같다. 조바심 내지 말고 천천히 가 보자.  3 - (4). 통계 분석  총조사 = 전수조사표본조사 : 당연히 대체로 표본조사 실시  - 모집단(Ω)  - 원소 : 모집단의 개체라는 점 주의  - 표본(s, χ)  - 모수(Parameter, δ, μ) : 표본을 통해 구하려는 모집단의 정보(target) 흑백요리사 강점기라 안 잊혀진다.모수의 예로는모평균, 모분산, 모비율, 모표준편차, 모상관관계 등이 있다.   샘플링 방법단순 랜덤 추출법(Simple Random Sampling)각 샘플에 index를 주고 임의의 n개 추출비복원추출(중복 불가) or 복원추출(중복 가능)계통추출법(Systemic ..

[ADsP] ADsP 요점정리 : Part 3. 데이터 마트

목요일 힘들다. 그래도 TIL도 잘 끝냈고 하니, 힘내서 정리 들어가 보자.  3 - (3). 데이터 마트 데이터 마트는 소규모 데이터 웨어하우스로 데이터 웨어하우스와 사용자 사이에 위치한다. 하나의 주제를 중심으로 특정 목적을 위해 운용하는 경우가 일반적. 하나의 비즈니스 프로젝트 단위로 떼낸 데이터라고 생각하면 될 듯.     통계, 시각화 등으로 데이터 의미 탐색주제 : 저항성의 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통하 현시성요약변수와 파생변수 생산요약변수변수들을 정해진 방법대로 종합해 생성하는 feature정석이 있고 재활용성이 높음(많은 모델에 쓰임)구조가 간단해 자동화하기 편리기간별 구매 금액 : 구매 패턴위클리 쇼퍼 : 고객 특성 추정상품별 구매 금액 : 라이프 스테이지 파악구매..

[ADsP] ADsP 요점정리 : Part 3. 데이터 분석 개요 / R 프로그래밍 기초

2주 남짓(!) 남기고 시작하는 ADsP 대비. KT 에이블스쿨을 진행하고 있어 데이터분석 자체는 해 볼 만 하겠지만 시험 치는 건 또 다른 문제지 ㅎㅎ.. Part 3이 제일 분량이 많으니 Part 3 부터 정리 시작한다. 이 포스팅은 철저하게 내가 보려고 하는 포스팅이므로, '내가 이건 안 해도 된다!'싶은 부분은 생략하고 진행되는 점 참고 바람.  3 - (1). 데이터 분석 개요 데이터 분석이란건 종류가 나뉘어 있다기보단,여러 기법을 적재적소에 활용해야 하는 것이라고 생각한다. 그래서 3-1에서도 데이터 분석의 주요 기법을 설명하고 있다. 구체적인 기법으로는시각화가장 낮은 수준의 분석탐색적 분석에 유용함SNA(Socail Network Analysis, 사회연결망분석)에 잘 쓰인다.공간분석(Spa..

[AICE ASSOCIATE] 개요 및 합격 후기

합격한 김에 개설한 AICE 탭. 추후에 PROFESSIONAL을 칠 수도 있으니 기록관리도 할겸앞으로 몇 개의 포스팅을 할 예정이다. AICE ASSOCIATE을 준비하는 이들에게 도움이 되었으면 한다.     AICE란? AICE는 KT와 한국경제신문에서 공동으로 발급하는 자격으로, 인공지능 활용능력을 측정하는 시험이다.  AICE는 난이도에 따라 Professional / Associate / Basic / Junior / Future 5단계로 구분된다. Basic 이하는 코딩이 없기 때문에 사실상 학생을 대상으로 한 시험으로,취직에서 이점을 얻기는 어렵다. 따라서 본인이 취준생이나 직장인이라면최소 Associate부터 준비한다고 생각해야 한다.     AICE Associate 시험 구성 AICE..