분류 전체보기
-
스파르타 KDT 내일배움캠프 수료 및 후기내일배움캠프(데이터 분석 부트캠프 1기)/마무리하며 2024. 5. 11. 22:01
2023년 12월부터 시작했던 스파르타 내일배움캠프 데이터 분석 트랙 1기가 4월 29일자로 마무리가 되었다.정규 과정은 최종 프로젝트 발표일인 29일에 마무리 되었지만 이력서 완성주차를 2주 추가로 진행하여 5월 10일에 마무리가 되었다. 과정을 하면서 이사를 포함해 크고 작은 일들이 있어, 멘탈도 많이 흔들렸지만 정신없이 달려온 끝에 잘 마무리를맺을 수 있었다. 부트캠프를 시작할 때 다짐했던 것이 있다. "주어진 5개월을 후회하지 않게 열심히 최선을 다해, 2024년에는 취직을 하자"고 다짐 했었는데그 5개월이 지난 지금 돌이켜보면 꽤나 열심히 했던 것 같다. 아직 취직은 결정된 바가 없지만... 과정을 하면서 가장 좋았던 부분은 수강하는 과목보다도 5번이나 진행되는 프로젝트 경험이었다. 프로젝트..
-
<LeetCode> Group Sold Products By The Date코딩테스트/SQL 코딩테스트 2024. 4. 10. 12:49
출처 : https://leetcode.com/problems/group-sold-products-by-the-date/description/ 문제요구사항 날짜 별로 판매된 다양한 제품의 수와 이름을 찾는 쿼리를 작성 ex) 2020-05-30, 3, Basketball, Headphone, T-shirt 위 처럼 해당하는 날짜의 제품 이름이 한 개의 컬럼에 표시되도록 해야함 각 날짜에 판매된 제품 이름은 사전순으로 정렬 정답코드 MySQL select sell_date, count(distinct product) as num_sold, group_concat(distinct product order by product) as products from activities group by sell_date..
-
<TIL> 2024-04-09내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 4. 9. 22:08
오늘 진행한 일 최종 프로젝트 파이썬 함수 작성(리텐션) SQL 코드테스트 https://datarian.io/blog/rolling-retention 리텐션 (2) Rolling Retention 롤링 리텐션은 '사용자가 이탈하지 않고 남아있는가?'에 초점을 맞추기 때문에 Unbounded Retention 이라고도 부릅니다. datarian.io 오늘은 파이썬을 이용해 롤링 리텐션과 n_day 리텐션을 구하는 함수를 작성하였다. 롤링 리텐션은 위의 데이터리안 링크를 참고하였다. 롤링 리텐션은 기준일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율을 나타내는데, 기준일 이후에 방문 기록이 있다면, 기준일 당시에는 이탈하지 않은 사용자로 계산한단 것이다. 함수는 아래와 같다. def visuali..
-
<TIL> 2024-04-04내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 4. 4. 23:59
오늘 진행한 일 수준별 학습 (태블로) 과제 최종 프로젝트 데이터 EDA SQL 코드테스트 태블로 AARRR 대시보드 제작을 위해서 몇 개의 KPI 지표와 그래프를 더 제작하였다. 1. 채널별 유입 인구 수 도넛 차트 2. 고착도(Stickness = DAU/WAU) 활성 유저의 경우에는 hit수가 3이상으로 정의하였다. 3. 채널별 유입 인구 수 도넛 차트 그리고 AARRR 퍼널에 대한 대시보드를 구체적으로 제작하기 위해서 Figma를 통해 전반적인 디자인을 잡고 러프하게 대시보드를 스케치 하였다. 메인화면이 될 KPI Overview 대시보드를 스케치하였고 위 4개에는 KPI 카드를 작성해서 집어넣을 예정이고 아래의 부분에는 KPI에 대한 상세 내용을 작성할 예정이다. 그리고 좌측 부분을 버튼으로 사..
-
<TIL> 2024-04-02내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 4. 2. 23:22
오늘 진행한 일 수준별 학습 (태블로) 과제 SQL 코드테스트 태블로 수준학습 과제는 AARRR 퍼널별 지표를 측정하여 대시보드 작성하는 과제였다. https://www.kaggle.com/competitions/ga-customer-revenue-prediction/data?select=train.csv Google Analytics Customer Revenue Prediction | Kaggle www.kaggle.com 사용한 데이터는 위 링크의 데이터이다. JSON데이터가 섞여있어서 파싱이 필요해서 전처리하여 데이터를 사용하였다. 최종 적으로는 AARRR 지표를 통해서 유저별 구매 트렌드와 각 퍼널별 주요 지표에 미치는 원인을 파악하여 대시보드를 작성하는 것이다. 그래서 우선 AARRR에서 많이..
-
<WIL> 2024년 3월 마지막 주 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 29. 23:37
이번 일주일 간은 최종 팀프로젝트 관련해서 데이터를 검색하고 EDA해보는 시간으로 대부분의 시간을 보냈다. 조금 나태해지고 있는 와중에 집중할 수 있는 목표가 생겨서 몰두하여 공부할 수 있었다. SQL 코드 테스트도 지속적으로 매일매일 풀면서 익숙해지고 있는 중이다. 몸은 그렇게 따라주지 못하면서 마음만 괜히 조급해하고 실제로는 마음만큼 행동하지 못하는 일주일을 보냈던 것 같다. 다음 주는 이번주에 계획만 세워보고 실천하지 못했던 일들을 진행하면서 조금 더 알차게 계획 있는 하루하루를 보내려고 한다. 이번 주 보다 더 나은 다음 주를 보내기로 약속하면서 오랜만의 주간회고를 마친다.
-
<TIL> 2024-03-29내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 29. 23:30
오늘 진행한 일 최종 프로젝트 데이터 EDA 최종 프로젝트 관련 튜터링 SQL 코드테스트 어제에 이어서 데이터 EDA를 진행했다. 어제는 click_stream에 있는 session에서 booking 이라는 event_name을 가진 행의 payment_status가 Success이거나 Failed인 경우 transaction 테이블에 해당하는 상품의 구매 혹은 취소 데이터가 있다는 것을 알아내었다. 그렇다면 booking이라는 event가 존재하지 않는 session은 없나? 라는 의문이 들었다. 왜냐면 click_stream 테이블은 customer_id를 가지지 않은 테이블이기 때문에 transaction 테이블과의 조인을 통해서만 고객 정보를 알아낼 수 있기 때문이다. 이를 확인함과 동시에 boo..
-
<TIL> 2024-03-28내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 28. 23:21
오늘 진행한 일 최종 프로젝트 데이터 EDA SQL 코드테스트 최종 프로젝트의 주제 e커머스로 선정하고 데이터를 찾았고 지난 실전 프로젝트에서는 데이터 정합성에 대한 이슈와 물류에 대한 이슈를 주로 확인했었는데 이번에는서비스와 고객 중심의 분석을 하기로 결정되었다. e커머스 회사의 데이터를 활용한 서비스 지표 확인 및 고객 이탈 혹은 수요를 예측해보는 것으로 하고 데이터를 탐색하였고 캐글에서 로그가 자세한 패션 커머스 데이터를 찾을 수 있었다. https://www.kaggle.com/datasets/latifahhukma/fashion-campus/data?select=click_stream.csv Fashion Campus www.kaggle.com 데이터의 형태는 아래 그림과 같다. 데이터 양이 방..