분류 전체보기
-
<TIL> 2024-01-26내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 1. 26. 20:56
오늘 진행한 일 Git 관련 특강 수강 통계학 강의 내용 복습 및 블로그 작성 오전에는 Git에 관련된 내용의 특강을 수강했다. Git에 대한 기본 개념과 Github 활용법에 대한 강의였다. 로컬 레퍼지토리와 리모트 레퍼지토리 환경에서 commit, push, pull하는 것을 배웠다. 과거에 개발자가 되기 위한 공부를 할 때 다 다뤘던 것들이긴했는데 복습하는 기분으로 들었다. 오후에는 이원배치 분산분석에 대해서 복습하면서 블로그를 작성했다. 작성한 블로그 링크는 아래에 첨부했다. https://jinhyunbae.tistory.com/136 분산분석(ANOVA) - 3 (Two-way ANOVA) 지난 번 작성한 일원배치 분산분석에 이어서 이원배치 분산분석에 대해서 작성해보려고한다. https://j..
-
<통계학> 분산분석(ANOVA) - 4 (Two-way ANOVA with Python)데이터 분석 관련 공부 2024. 1. 26. 15:44
https://jinhyunbae.tistory.com/136 분산분석(ANOVA) - 3 (Two-way ANOVA) 지난 번 작성한 일원배치 분산분석에 이어서 이원배치 분산분석에 대해서 작성해보려고한다. https://jinhyunbae.tistory.com/133 분산분석(ANOVA) -1 (One-way-ANOVA) 분산분석(ANOVA) t 검정이 두 집단간의 평균 jinhyunbae.tistory.com 이원배치 분산분석을 python scipy 라이브러리로 구현해보자 데이터 불러오기 우선 사용할 라이브러리를 import하고 데이터를 불러온다. 사용한 데이터는 R 내장데이터인 mtcars를 이용했다. mtcars = pd.read_csv('../data/mtcars.csv') display(mt..
-
<통계학> 분산분석(ANOVA) - 3 (Two-way ANOVA)데이터 분석 관련 공부 2024. 1. 26. 14:12
지난 번 작성한 일원배치 분산분석에 이어서 이원배치 분산분석에 대해서 작성해보려고한다. https://jinhyunbae.tistory.com/133 분산분석(ANOVA) -1 (One-way-ANOVA) 분산분석(ANOVA) t 검정이 두 집단간의 평균차이를 비교하는데 쓰이는 통계분석 방법이라면 두 개 이상의 다수 집단 간 평균을 비교하는 통계적 방법은 무엇일까? 그게 바로 분산분석이다. 참고로 jinhyunbae.tistory.com 이원배치 분산분석(Two-way ANOVA) 분산 분석 중에서 Two-way ANOVA라는 것은 한국어로는 이원분산분석 혹은 이원배치 분산분석이라고 하는데 독립변수가 2개일 때 집단 간 종속변수의 차이를 검증하기 위해서 사용되는 방법이다. 집단 간 평균차이를 비교한다는 ..
-
<TIL> 2024-01-25내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 1. 25. 21:31
오늘 진행한 일 통계학 강의 내용 복습 및 블로그 작성 SQL 코딩테스트 오늘은 일원배치 분산분석에 대해서 복습하면서 블로그를 작성했다. 작성한 블로그 링크는 아래에 첨부했다. https://jinhyunbae.tistory.com/133 분산분석(ANOVA) -1 (One-way-ANOVA) 분산분석(ANOVA) t 검정이 두 집단간의 평균차이를 비교하는데 쓰이는 통계분석 방법이라면 두 개 이상의 다수 집단 간 평균을 비교하는 통계적 방법은 무엇일까? 그게 바로 분산분석이다. 참고로 jinhyunbae.tistory.com https://jinhyunbae.tistory.com/134 분산분석(ANOVA) - 2 (One way ANOVA with Python) https://jinhyunbae.tis..
-
<통계학> 분산분석(ANOVA) - 2 (One way ANOVA with Python)데이터 분석 관련 공부 2024. 1. 25. 17:55
https://jinhyunbae.tistory.com/133 분산분석(ANOVA) -1 (One-way-ANOVA) 분산분석(ANOVA) t 검정이 두 집단간의 평균차이를 비교하는데 쓰이는 통계분석 방법이라면 두 개 이상의 다수 집단 간 평균을 비교하는 통계적 방법은 무엇일까? 그게 바로 분산분석이다. 참고로 jinhyunbae.tistory.com 일원배치 분산분석을 python scipy 라이브러리로 구현해보자 데이터 불러오기 우선 사용할 라이브러리를 import하고 데이터를 불러온다. 데이터는 가장 흔한 범주별 데이터를 담고 있는 붓꽃(iris)데이터를 이용하였다. iris = pd.read_csv('../data/iris.csv') display(iris.head(10)) 일반적으로는 머신러닝 ..
-
<통계학> 분산분석(ANOVA) -1 (One-way-ANOVA)데이터 분석 관련 공부 2024. 1. 25. 15:59
분산분석(ANOVA) t 검정이 두 집단간의 평균차이를 비교하는데 쓰이는 통계분석 방법이라면 두 개 이상의 다수 집단 간 평균을 비교하는 통계적 방법은 무엇일까? 그게 바로 분산분석이다. 참고로 ANOVA는 ANalysis Of VAriance 즉 영어로 분산분석을 줄인 말이다. 일원배치 분산분석(One-way ANOVA) 분산 분석 중에서 One-way ANOVA라는 것은 한국어로는 일변량 분산분석 혹은 일원배치 분산분석이라고 하는데 독립변수가 3개 이상인 집단일 때 집단 간 종속변수의 차이를 검증하기 위해서 사용되는 방법이다. 집단 간 평균차이를 비교한다는 점에서 t검정과 유사하다고 생각할 수 있다. 그렇다면 집단이 3개일 때 t-test를 3번 하면 모든 집단을 비교 가능한 게 아닌가? 상당히 곤란..
-
<TIL> 2024-01-24내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 1. 24. 22:07
오늘 진행한 일 데이터 전처리 및 시각화 강의 수강 완료 데이터 주차 개인과제 통계학 강의 내용 복습 및 블로그 작성 오늘은 데이터 전처리 및 시각화 강의를 수강했다. pandas 라이브러리를 이용한 데이터 핸들링과 matplotlib을 이용한 시각화에 대해서 다룬 강의였는데 대부분 아는 내용이었기 때문에 가벼운 마음으로 복습했다. 그리고 오늘 오후 12시에 출제된 데이터 주차 개인과제를 풀었다. 다음주 월요일까지 제출인데 다 풀었기 때문에 덕분에 여유롭게 통계학 공부를 좀 더 진행할 수 있을 것 같다. 그래서 어제 진행하던 t검정에 관해서 마저 정리했다. 아래는 오늘 정리한 t검정 관련 python 코드 정리 블로그 링크이다. https://jinhyunbae.tistory.com/131 t검정(t-t..
-
<통계학> t검정(t-test) - 2 (with Python)데이터 분석 관련 공부 2024. 1. 24. 21:40
https://jinhyunbae.tistory.com/129 t검정(t-test) - 1 t검정이란 검정통계량이 귀무가설 하에서 t-분포를 따르는 통계적 가설검정이다. 어느 특정한 집단의 평균의 값을 추정하거나 두 집단의 평균 차이를 검정할 때 사용할 수 있다. t분포란? t분포 jinhyunbae.tistory.com 위 링크에서 설명한 t검정을 python의 scipy라이브러리로 구현해보자 데이터는 R에서 제공하는 cat 데이터를 csv 파일로 저장한 것이다. https://github.com/vincentarelbundock/Rdatasets/blob/master/csv/MASS/cats.csv 데이터 불러오기 우선 사용할 라이브러리를 import하고 데이터를 불러온다. import numpy a..