내일배움캠프(데이터 분석 부트캠프 1기)
-
<TIL> 2024-02-27내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 28. 10:57
오늘 진행한 일 SQL 코딩 테스트 개인 프로젝트 시작 오늘 오전도 평소와 동일하게 SQL 코딩테스트로 시작했다. SQL 입사 코딩테스트를 수월하게 풀 수 있는 수준까지 끌어올려서 폼을 유지하는 걸 목표로 하고 있기 때문에 부트캠프가 끝나는 4월말까지 꾸준하게 하루 3문제 이상을 풀 예정이다. 어제 자로 태블로 개인과제를 마무리했기 때문에 내일 오후까지 학습을 할 게 필요했다. 튜터님이 개인 과제를 선정한 이유에 대해서 튜터링 시간에 대화를 나눌 기회가 있었는데 태블로 대시보드 포트폴리오가 상당히 강력하며, A/B테스트와 관련해 통계학적인 지식을 면접에서 많이 요구하기 때문에 이를 대비시키고자 선정하였다고 하셨다. 그 부분에 대한 고민을 포함해 남은 시간을 어떻게 보낼까 생각을 하다 개인 프로젝트를 진행..
-
<TIL> 2024-02-26내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 26. 22:18
오늘 진행한 일 SQL 코딩 테스트 Tableu 개인과제 오늘 오전에는 해커랭크의 SQL 코딩테스트 문제를 풀었고 오후 시간은 주말부터 조금씩 진행했던 Tableu 개인과제 문제를 끝까지 풀었다. 대시보드 제작에 사용된 데이터는 A/B test와 관련된 데이터였다. https://www.kaggle.com/datasets/zhangluyuan/ab-testing A/B testing www.kaggle.com 개인과제 문제는 총 워크시트를 7개 만드는 것으로 문제의 요구사항은 아래와 같았다. 난이도 하 워크시트 1번: 그룹별 유저 비중 파이 차트 시각화 워크시트 2번: 그룹별 평균 전환율 막대 그래프 시각화 워크시트 3번: 일별 그룹별 평균 전환율 선 그래프 시각화 워크시트 4번: 그룹별 유저 고유 카운..
-
<WIL> 2024년 2월 4주차 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 23. 22:28
2024년 2월 4주차 회고 이번 주에는 많은 일들이 있었다. 한 주 한 주가 너무 빠르게 지나간다는 느낌을 받고 있고 취업에 대한 압박이 느껴지고 있다. 여러가지 개인적인 일도 겹쳐서 멘탈도 아주 많이 흔들리는 한 주였다. 우선 월요일에 팀프로젝트의 발표가 있었고 그 이후 새로운 팀의 배정이 진행되었다. 그리고 학습 부분에서는 태블로 시각화 강의수강이 있었다 처음 써보는 태블로가 익숙하지 않아서 많이 시행착오를 겪었지만 열심히 계속 하다보면 또 잘 다룰 수 있게 될 거라고 믿는다. 팀 프로젝트에 관해서는 개인적으로는 노력했다고 생각하지만 주제 선정과정에서 스파르타 튜터진이 선정한 데이터를 이용하여 분석을 진행하다보니 왜 분석하는지, 즉 분석의 목적이 빠져있었고 그래서인지 분석 결과를 이용한 액션플랜을 ..
-
<TIL> 2024-02-23내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 23. 22:23
오늘 진행한 일 SQL 코딩 테스트 문제 풀기 스파르타 Tableu 강의 수강 Tableu 실습(대시보드 설계 및 작성) 우선 프로젝트와 다른 개인학습을 핑계로 미뤄왔던 SQL 코딩테스트에 시동을 걸었다. 조금 난이도 있는 코딩테스트의 문제가 빠릿빠릿하게 생각이 나질 않아서 조금 쉬운 문제에서부터 시작하여 다시 감각을 키우고자 해커링크의 문제를 풀기 시작했다. 초반 문제는 난이도가 그래도 쉬운 편이었기 때문에 10문제를 후딱 풀었고 오후 학습을 시작했다. 앞으로 다시 매일 3문제 이상은 꾸준히 풀어보려고 한다. 오늘은 스파르타 Tableu강의를 다 수강하는 것이 목표였고 이를 완수했다. Tableu의 Superstore 데이터셋을 이용하여 대시보드를 구축해보는 실습을 해보는 파트였고 데이터를 보고 지표를..
-
<TIL> 2024-02-22내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 22. 23:20
오늘 진행한 일 팀 빌딩 팀 프로젝트 내용 블로그 작성 스파르타 Tableu 강의 수강 오늘 오전은 팀빌딩 시간으로 진행되었다. 새로운 프로젝트의 조원 배정 때문에 상당히 긴장해있었는데 조원들이랑 이야기를 나눠보면서 이번 프로젝트도 괜찮게 진행 될 것 같다는 안도감이 들었다. 오늘은 어제 작성하던 지난 팀 프로젝트와 관련한 내용을 마저 정리하였다. https://jinhyunbae.tistory.com/161 와인 가격 예측 - 2 [와인 가격 예측 -1]에서 이어짐 링크 : https://jinhyunbae.tistory.com/159 와인 가격 예측 - 1 개요 프로젝트 모델링 과정의 개요는 아래 그림과 같다. 우선 데이터에 대해 EDA와 전처리를 진행하고 파생변 jinhyunbae.tistory.c..
-
<심화 프로젝트> 와인 가격 예측 - 2내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 2. 22. 15:27
[와인 가격 예측 -1]에서 이어짐 링크 : https://jinhyunbae.tistory.com/159 와인 가격 예측 - 1 개요 프로젝트 모델링 과정의 개요는 아래 그림과 같다. 우선 데이터에 대해 EDA와 전처리를 진행하고 파생변수를 생성했다. 그리고 전처리된 데이터로 모델링 과정을 진행하였다. 첫 번째로 모 jinhyunbae.tistory.com 모델링 앙상블(Ensemble) 모델 앙상블 모델이란 여러 개의 개별 모델을 조합하여 최적의 모델로 일반화하는 머신러닝 방법이다. 대표적인 방법으로는 배깅과 부스팅이 있다. 본 프로젝트에서는 배깅을 활용한 대표적인 알고리즘인 RandomForest의 Regression모델과 XGBoost의 Regression 모델을 사용하였다. RandomFores..
-
<TIL> 2024-02-21내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 21. 23:28
오늘 진행한 일 스파르타 tableu 강의 수강 팀 프로젝트 내용 블로그 작성 팀 프로젝트 Develop, 튜터님께 문의 우선 본격적으로 tableud 강의를 수강하기 시작했다. 확실히 파이썬 코드로 치려면 한참 걸릴 만한 작업들을 UI 드래그 앤 드롭으로 해결할 수 있다는 점에서 상당히 매력적인 툴이다. 유료에 심지어 좀 비싸다는 부분만 빼면.. 스파르타에서 강의를 듣는 동안 쓸 수 있게 라이센스를 열어줘서 편안하게 학습할 수 있었다. 오늘은 다양한 기초적인 그래프를 시각화 하는 방법에 대해서 배웠고 대시보드를 간단하게 만드는 방법에 대해서 배웠다. 오늘 만든 그래프는 아래 그림과 같다. 태블로에 대해서는 따로 학습한 내용을 블로그로 정리하려고 한다. 맨날 쓴다 하면서 밀린 것들이 많은데 빠릿빠릿하게 ..
-
<심화 프로젝트> 와인 가격 예측 - 1내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 2. 21. 19:29
개요 프로젝트 모델링 과정의 개요는 아래 그림과 같다. 우선 데이터에 대해 EDA와 전처리를 진행하고 파생변수를 생성했다. 그리고 전처리된 데이터로 모델링 과정을 진행하였다. 첫 번째로 모델은 결측치를 삭제한 상태에서 모델을 학습하고 성능을 평가했으며 두 번째 모델은 머신러닝을 통해 결측치를 보간한 뒤 학습하여 성능을 평가했다. 세 번째는 두 번째 모델의 결측치 보간 데이터를 사용했으며 모델을 파생변수를 기준으로 둘로 나누어 각각 모델링하였다. 데이터 사용한 데이터는 Kaggle의 Wine Information이라는 데이터였다. 데이터는 한국의 웹사이트에서 얻어진 21605개의 와인 데이터이다. 출처 링크 : https://www.kaggle.com/datasets/dev7halo/wine-informa..