내일배움캠프(데이터 분석 부트캠프 1기)
-
<TIL> 2024-03-08내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 8. 21:10
오늘 진행한 일 팀 프로젝트 대시보드 디자인 추가 대시보드 제작을 위한 데이터 EDA https://jinhyunbae.tistory.com/174 2024-03-06 오늘 진행한 일 팀 프로젝트 트러블 슈팅 팀 프로젝트 관련 튜터링 진행 https://jinhyunbae.tistory.com/173 2024-03-05 오늘 진행한 일 팀 프로젝트 데이터 전처리 팀 프로젝트 문제 해결 SQL 코딩 테스트 http jinhyunbae.tistory.com 오늘은 이제 이 때까지 전처리 작업했던 데이터를 태블로에 적재해서 대시보드를 작성하였다. 우선 스케치 작업부터 진행을 했고 좀 더 효과적으로 보여줄 수 있는 레이아웃을 고민했다. 피피티를 이용해 간단하게 스케치를 해본 뒤 태블로 대시보드 작업을 시작하였다..
-
<TIL> 2024-03-06내일배움캠프(데이터 분석 부트캠프 1기) 2024. 3. 6. 23:46
오늘 진행한 일 팀 프로젝트 트러블 슈팅 팀 프로젝트 관련 튜터링 진행 https://jinhyunbae.tistory.com/173 2024-03-05 오늘 진행한 일 팀 프로젝트 데이터 전처리 팀 프로젝트 문제 해결 SQL 코딩 테스트 https://jinhyunbae.tistory.com/172 2024-03-04 오늘 진행한 일 팀 프로젝트 데이터 전처리 팀 프로젝트 문제 해결 오늘 한 jinhyunbae.tistory.com 오늘도 어제자에 진행하던 팀프로젝트 내용에 이어서 프로젝트를 진행하였다. 1. 하나의 세션 안에 두 유저가 있는지 여부 2. 한 유저가 두 도시에서 접속한 경우 3. 유저 ID가 없는 경우(Null) 4. Event가 발생하지 않았는데 구매 이력이 존재하는 경우 5. 30분..
-
<TIL> 2024-03-05내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 5. 22:09
오늘 진행한 일 팀 프로젝트 데이터 전처리 팀 프로젝트 문제 해결 SQL 코딩 테스트 https://jinhyunbae.tistory.com/172 2024-03-04 오늘 진행한 일 팀 프로젝트 데이터 전처리 팀 프로젝트 문제 해결 오늘 한 일은 지난 주 목요일에서 이어진다. https://jinhyunbae.tistory.com/170 2024-02-29 오늘 진행한 일 SQL 코딩 테스트 팀 프로젝트 발 jinhyunbae.tistory.com events 데이터의 정합성을 검증 1. 하나의 세션 안에 두 유저가 있는지 여부 2. 한 유저가 두 도시에서 접속한 경우 3. 유저 ID가 없는 경우(Null) 4. Event가 발생하지 않았는데 구매 이력이 존재하는 경우 5. 30분 이상 지속되는 이상 ..
-
<TIL> 2024-03-04내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 4. 23:28
오늘 진행한 일 팀 프로젝트 데이터 전처리 팀 프로젝트 문제 해결 오늘 한 일은 지난 주 목요일에서 이어진다. https://jinhyunbae.tistory.com/170 2024-02-29 오늘 진행한 일 SQL 코딩 테스트 팀 프로젝트 발제 팀 프로젝트 데이터 선정 및 간단한 EDA 오전에는 실전 팀프로젝트의 발제가 있었다. 팀 프로젝트에서 활용할 데이터가 위 사진처럼 5개 주어지 jinhyunbae.tistory.com events 데이터의 데이터의 정합성을 검증하는 것이 목표인데 확인해야할 것은 여러가지가 있었는데 구체적으로는 아래와 같다. 1. 하나의 세션 안에 두 유저가 있는지 여부 2. 한 유저가 두 도시에서 접속한 경우 3. 유저 ID가 없는 경우(Null) 4. Event가 발생하지 않..
-
<WIL> 2024년 2월 마지막 주 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 29. 22:57
2024년 2월 마지막 주 회고 이번 주는 팀 배정부터 팀 프로젝트의 발제가 있었는데 배정된 팀원들이 매우 마음에 들었다. 한 주동안 같이 학습하면서 회고를 진행했는데 팀원들이 열심히 하는 모습들을 보면서 느끼는 바가 많았다. 나도 저렇게 계획을 더 세우고, 조금 더 시간을 알차게 쓰고 싶다는 생각을 했다. 팀원들이 본받을 만한 사람들이라서 빡세지만 만족스러운 팀 프로젝트가 될 것 같다. 내일배움캠프도 이제 절반 정도가 지났다. 오늘은 이 캠프를 시작하기 전보다 내가 발전 했는지, 얼마나 노력했는지를 점검하는 시간이 되었다. 그래도 시작하기 전에는 하루에 12시간 동안 컴퓨터 앞에 앉아서 집중한다는 건 생각지도 못했던 일인데 부트캠프가 주는 강제성 덕분에 12시간 중 8시간은 열심히 공부할 수 있었다. ..
-
<TIL> 2024-02-29내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 29. 22:46
오늘 진행한 일 SQL 코딩 테스트 팀 프로젝트 발제 팀 프로젝트 데이터 선정 및 간단한 EDA 오전에는 실전 팀프로젝트의 발제가 있었다. 팀 프로젝트에서 활용할 데이터가 위 사진처럼 5개 주어지고 그 중에 하나를 선택해야 했는데 우리 조는 [그룹 E] 커머스 데이터 품질 검사 데이터를 선택하였다. 데이터는 캐글을 looker E-커머스 빅쿼리 데이터이다. https://www.kaggle.com/datasets/mustafakeser4/looker-ecommerce-bigquery-dataset?select=events.csv Looker Ecommerce BigQuery Dataset CSV version of BigQuery Looker Ecommerce Dataset www.kaggle.com 위..
-
<BI 대시보드> 개인과제(with Tableu)내일배움캠프(데이터 분석 부트캠프 1기)/개인과제 2024. 2. 29. 19:50
데이터분석 숙련 주차 개인 과제는 시각화 중심의 BI툴인 태블로로 대시보드를 만드는 것이었다. 데이터는 A/B test에 관련된 캐글 데이터였다. https://www.kaggle.com/datasets/zhangluyuan/ab-testing A/B testing www.kaggle.com 문제 요구사항은 아래와 같았다. 워크시트 1번: 그룹별 유저 비중 파이 차트 시각화 워크시트 2번: 그룹별 평균 전환율 막대 그래프 시각화 워크시트 3번: 일별 그룹별 평균 전환율 선 그래프 시각화 워크시트 4번: 그룹 별 유저 고유 카운트 요일 별 캘린더 차트 만들기 워크시트 5번(대시보드에는 불포함) : 데이터 정합성 체크 & 전처리 작업(대시보드 적용) 워크시트 6번: 도넛 차트 활용 평균 전환율 지표 카드 만..
-
<TIL> 2024-02-28내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 28. 23:07
오늘 진행한 일 SQL 코딩 테스트 개인 프로젝트 (통계 분석) 하루 루틴인 SQL 코딩테스트 3문제를 클리어한 뒤 개인 프로젝트 데이터에 대한 전처리 및 통계분석을 실시했다. 우선 어제 EDA를 해본 결과 이상치가 데이터에 꽤 있는 것을 확인할 수 있었는데 Z-score를 기준으로 3을 넘어가는 데이터가 425개 있는 것을 확인하였다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns cookie_cats = pd.read_csv('./data/cookie_cats.csv') cookie_cats m = cookie_cats['sum_gamerounds'].mean() s = cookie..