내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL
-
<TIL> 2024-04-09내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 4. 9. 22:08
오늘 진행한 일 최종 프로젝트 파이썬 함수 작성(리텐션) SQL 코드테스트 https://datarian.io/blog/rolling-retention 리텐션 (2) Rolling Retention 롤링 리텐션은 '사용자가 이탈하지 않고 남아있는가?'에 초점을 맞추기 때문에 Unbounded Retention 이라고도 부릅니다. datarian.io 오늘은 파이썬을 이용해 롤링 리텐션과 n_day 리텐션을 구하는 함수를 작성하였다. 롤링 리텐션은 위의 데이터리안 링크를 참고하였다. 롤링 리텐션은 기준일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율을 나타내는데, 기준일 이후에 방문 기록이 있다면, 기준일 당시에는 이탈하지 않은 사용자로 계산한단 것이다. 함수는 아래와 같다. def visuali..
-
<TIL> 2024-04-04내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 4. 4. 23:59
오늘 진행한 일 수준별 학습 (태블로) 과제 최종 프로젝트 데이터 EDA SQL 코드테스트 태블로 AARRR 대시보드 제작을 위해서 몇 개의 KPI 지표와 그래프를 더 제작하였다. 1. 채널별 유입 인구 수 도넛 차트 2. 고착도(Stickness = DAU/WAU) 활성 유저의 경우에는 hit수가 3이상으로 정의하였다. 3. 채널별 유입 인구 수 도넛 차트 그리고 AARRR 퍼널에 대한 대시보드를 구체적으로 제작하기 위해서 Figma를 통해 전반적인 디자인을 잡고 러프하게 대시보드를 스케치 하였다. 메인화면이 될 KPI Overview 대시보드를 스케치하였고 위 4개에는 KPI 카드를 작성해서 집어넣을 예정이고 아래의 부분에는 KPI에 대한 상세 내용을 작성할 예정이다. 그리고 좌측 부분을 버튼으로 사..
-
<TIL> 2024-04-02내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 4. 2. 23:22
오늘 진행한 일 수준별 학습 (태블로) 과제 SQL 코드테스트 태블로 수준학습 과제는 AARRR 퍼널별 지표를 측정하여 대시보드 작성하는 과제였다. https://www.kaggle.com/competitions/ga-customer-revenue-prediction/data?select=train.csv Google Analytics Customer Revenue Prediction | Kaggle www.kaggle.com 사용한 데이터는 위 링크의 데이터이다. JSON데이터가 섞여있어서 파싱이 필요해서 전처리하여 데이터를 사용하였다. 최종 적으로는 AARRR 지표를 통해서 유저별 구매 트렌드와 각 퍼널별 주요 지표에 미치는 원인을 파악하여 대시보드를 작성하는 것이다. 그래서 우선 AARRR에서 많이..
-
<WIL> 2024년 3월 마지막 주 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 29. 23:37
이번 일주일 간은 최종 팀프로젝트 관련해서 데이터를 검색하고 EDA해보는 시간으로 대부분의 시간을 보냈다. 조금 나태해지고 있는 와중에 집중할 수 있는 목표가 생겨서 몰두하여 공부할 수 있었다. SQL 코드 테스트도 지속적으로 매일매일 풀면서 익숙해지고 있는 중이다. 몸은 그렇게 따라주지 못하면서 마음만 괜히 조급해하고 실제로는 마음만큼 행동하지 못하는 일주일을 보냈던 것 같다. 다음 주는 이번주에 계획만 세워보고 실천하지 못했던 일들을 진행하면서 조금 더 알차게 계획 있는 하루하루를 보내려고 한다. 이번 주 보다 더 나은 다음 주를 보내기로 약속하면서 오랜만의 주간회고를 마친다.
-
<TIL> 2024-03-29내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 29. 23:30
오늘 진행한 일 최종 프로젝트 데이터 EDA 최종 프로젝트 관련 튜터링 SQL 코드테스트 어제에 이어서 데이터 EDA를 진행했다. 어제는 click_stream에 있는 session에서 booking 이라는 event_name을 가진 행의 payment_status가 Success이거나 Failed인 경우 transaction 테이블에 해당하는 상품의 구매 혹은 취소 데이터가 있다는 것을 알아내었다. 그렇다면 booking이라는 event가 존재하지 않는 session은 없나? 라는 의문이 들었다. 왜냐면 click_stream 테이블은 customer_id를 가지지 않은 테이블이기 때문에 transaction 테이블과의 조인을 통해서만 고객 정보를 알아낼 수 있기 때문이다. 이를 확인함과 동시에 boo..
-
<TIL> 2024-03-28내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 28. 23:21
오늘 진행한 일 최종 프로젝트 데이터 EDA SQL 코드테스트 최종 프로젝트의 주제 e커머스로 선정하고 데이터를 찾았고 지난 실전 프로젝트에서는 데이터 정합성에 대한 이슈와 물류에 대한 이슈를 주로 확인했었는데 이번에는서비스와 고객 중심의 분석을 하기로 결정되었다. e커머스 회사의 데이터를 활용한 서비스 지표 확인 및 고객 이탈 혹은 수요를 예측해보는 것으로 하고 데이터를 탐색하였고 캐글에서 로그가 자세한 패션 커머스 데이터를 찾을 수 있었다. https://www.kaggle.com/datasets/latifahhukma/fashion-campus/data?select=click_stream.csv Fashion Campus www.kaggle.com 데이터의 형태는 아래 그림과 같다. 데이터 양이 방..
-
<TIL> 2024-03-26내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 26. 23:42
오늘 진행한 일 최종 프로젝트 팀 빌딩 최종 프로젝트 데이터 검색 및 EDA 토스 PO Session 시청 및 블로그 정리 SQL 코드테스트 오늘 오전은 최종 팀프로젝트에 대한 발제가 있었다. 원하던 팀과의 편성에 성공했기 때문에 가벼운 마음으로 프로젝트를 시작할 수 있을 것 같다. 프로젝트 기간이 한달이 넘다보니 데이터 선정에 공을 들여 다양한 분석이 가능하면서도 효과적인 포트폴리오를 만들 수 있을 것 같은 그런 데이터 셋을 찾고자 했다. https://www.kaggle.com/datasets/hserdaraltan/underwear-data-with-11-tables-and-up-to-100k-rows?select=inventory_transactions.csv Underwear Data with ..
-
<TIL> 2024-03-21내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 21. 22:44
오늘 진행한 일 개인 프로젝트 대시보드 작성 A/B 테스트 관련 내용 검색 및 학습 SQL 코드테스트 https://jinhyunbae.tistory.com/168 2024-02-28 오늘 진행한 일 SQL 코딩 테스트 개인 프로젝트 (통계 분석) 하루 루틴인 SQL 코딩테스트 3문제를 클리어한 뒤 개인 프로젝트 데이터에 대한 전처리 및 통계분석을 실시했다. 우선 어제 EDA를 해본 jinhyunbae.tistory.com 한 달 전쯤 프로젝트를 시작하기 전에 개인 프로젝트 용으로 찾아놨던 데이터에 대해서 간단하게 EDA를 하고 전처리 한 뒤 통계 분석까지 했던 것을 이제 대시보드화 하기 위해서 다시 훑어보기 시작했다. https://medium.com/bondata/a-b-%ED%85%8C%EC%8A%..