개인과제
-
<TIL> 2024-02-29내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 29. 22:46
오늘 진행한 일 SQL 코딩 테스트 팀 프로젝트 발제 팀 프로젝트 데이터 선정 및 간단한 EDA 오전에는 실전 팀프로젝트의 발제가 있었다. 팀 프로젝트에서 활용할 데이터가 위 사진처럼 5개 주어지고 그 중에 하나를 선택해야 했는데 우리 조는 [그룹 E] 커머스 데이터 품질 검사 데이터를 선택하였다. 데이터는 캐글을 looker E-커머스 빅쿼리 데이터이다. https://www.kaggle.com/datasets/mustafakeser4/looker-ecommerce-bigquery-dataset?select=events.csv Looker Ecommerce BigQuery Dataset CSV version of BigQuery Looker Ecommerce Dataset www.kaggle.com 위..
-
<BI 대시보드> 개인과제(with Tableu)내일배움캠프(데이터 분석 부트캠프 1기)/개인과제 2024. 2. 29. 19:50
데이터분석 숙련 주차 개인 과제는 시각화 중심의 BI툴인 태블로로 대시보드를 만드는 것이었다. 데이터는 A/B test에 관련된 캐글 데이터였다. https://www.kaggle.com/datasets/zhangluyuan/ab-testing A/B testing www.kaggle.com 문제 요구사항은 아래와 같았다. 워크시트 1번: 그룹별 유저 비중 파이 차트 시각화 워크시트 2번: 그룹별 평균 전환율 막대 그래프 시각화 워크시트 3번: 일별 그룹별 평균 전환율 선 그래프 시각화 워크시트 4번: 그룹 별 유저 고유 카운트 요일 별 캘린더 차트 만들기 워크시트 5번(대시보드에는 불포함) : 데이터 정합성 체크 & 전처리 작업(대시보드 적용) 워크시트 6번: 도넛 차트 활용 평균 전환율 지표 카드 만..
-
<TIL> 2024-02-05내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 6. 00:41
오늘 진행한 일 머신러닝 개인과제 해설 강의 수강 머신러닝 개인과제 심화학습 보충 오늘 오전에는 머신러닝 개인과제 해설 강의를 수강했고 데이터 전처리부분부터 상세하게 해설을 들었다. 데이터 분석을 하는데 있어서 생각하지 못했던 부분들은 튜터님이 짚어주셔서 좀 더 이해가 깊어지는 시간이었다. 그리고 오후에는 개인과제에서 챌린지 부분에 해당했던 제공해준 코드 없이 처음부터 끝까지 스스로 했던 머신러닝 코드를 손보았다. 이를 통해 데이터의 전처리에 대해서 더 깊게 고민하고 새로운 전처리 방법을 배우는 시간이 되었다. https://jinhyunbae.tistory.com/148 개인 과제(with XGBoost) 머신러닝 개인과제는 금융 데이터로 텔레마케팅 권유를 하기 위해 대출을 할 것 같은 고객을 사전에 ..
-
<TIL> 2024-02-02내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 2. 23:24
오늘 진행한 일 머신러닝 개인과제 심화 학습 어제는 스파르타에서 낸 머신러닝 개인과제에서 기본적인 문제를 풀었고 문제 요구사항 중에 선택사항과 심화 학습과정을 오늘 수행했다. 기본 문제는 사전에 작성된 코드의 빈칸을 채우는 방식으로 머신러닝 문제를 푸는 것이고 심화 학습 과정은 사전에 제공된 코드없이 전처리부터 분석 결과를 보는 전체 과정을 직접 해보는 것이었다. 머신러닝은 그래도 익숙하다고 생각해서 코드를 잘 써내려가긴 했지만 아직도 전처리를 어느정도 진행한 뒤에 하이퍼파라미터 튜닝을 하면서 모델 성능을 올릴 때 내가 맞게 하고 있는 것인가에 대한 확신이 없다. 아마 대학원 기간 동안에 사혼의 구슬조각 맞추듯이 머신러닝을 배워서 그렇게 된 것이 아닐까 싶다. 이번 학습 기회를 빌어서 튜터님을 귀찮게 만..
-
<TIL> 2024-01-04내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 1. 4. 21:24
오늘 학습한 것 스파르타 파이썬 문법 기초 강의 수강 내일배움캠프 파이썬 기초 개인과제 데이터 공부법 및 취업 특강 수강 오전부터는 2시간 짜리 파이썬 문법 기초 강의를 수강했다. 강의 자체는 파이썬의 정말 기초적인 문법에서 약간의 문법적 응용에 대한 강의였다. 강의 내용 대부분은 다 자주 사용하고 있는 내용이었는데 판다스 테이블 형태의 데이터를 핸들링 하는 것만 익숙해져있다보니 딕셔너리, 클래스, 튜플 이런 문법 형태들이 어색하게 다가왔다. 그리고 오후에는 배운 내용을 기반으로한 파이썬 기초에 관한 개인과제를 풀었다. 단순한 파이썬 알고리즘에 대한 문제를 데이터 분석 테마에 맞춘 예시를 들어 낸 문제였다. 푼 과제 코드는 아래와 같다. 1. 제품 재고 관리 각 제품의 제고량이 주어진 기준치보다 많은지 ..
-
<TIL> 2024-01-02내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 1. 2. 21:03
내일배움캠프 본 캠프 10일차 TIL 작성 2024년 새해 첫 학습일지 오늘 학습한 것 내일배움캠프 SQL 개인과제 문제 정현석 튜터님 SQL 특강 지난 주 금요일에 개인과제를 다 완료하지 못해서 오늘 마저 다 풀게 되었다. 오늘 애를 먹었던 문제는 아래 사진의 문제이다. 우선 테이블이 3개가 있고 3개의 테이블을 통해서 조회해야하는 문제 요구사항은 다음과 같다. 각 주(State)별로 주문의 총 금액(Amount)을 계산 각 주(State)별로 주문의 총 이익(Profit)을 계산 각 주(State)내에서 주문의 매출 순위를 결정 각 주(State)내에서 주문의 총 금액이 해당 카테고리의 평균 매출 목표의 50%를 달성했는지의 여부를 판단 우선 조회해야하는 데이터가 그룹을 지을 것을 요구하는데 각 요구..