내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트
-
실전 프로젝트 KPT 회고내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 3. 13. 12:19
KPT회고 - 프로젝트 기간 : 2024.03.01 ~ 2024.03. 12 - 조 이름 : 데이터 몬스터(A03) - 조원 : 권재혁, 김승연, 배진현(나), 이태림 Keep : 잘하고 있으며 앞으로도 지속 했으면 좋겠겠다고 생각하는 점. Problem : 문제가 있으며 변화가 필요한 점. Try : 잘하고 있는 것을 더 잘하기 위해서, 문제가 있는 점을 해결하기 위해서 우리가 시도해 볼 것들 Keep : 팀원들과 지속적으로 소통함. 화기애애한 분위기가 힘든 과제를 하는 중에 많은 도움이 되었다고 생각함. Problem : 조금 욕심을 부려서 프로젝트의 판을 키워버렸는데 이 부분도 처음부터 계획에 넣어서 진행했으면 좋았을 것 같다고 생각함. 도중에 갑자기 커진 판을 감당하려다가 발표 직전까지 눈물의 태..
-
<심화 프로젝트> 와인 가격 예측 - 2내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 2. 22. 15:27
[와인 가격 예측 -1]에서 이어짐 링크 : https://jinhyunbae.tistory.com/159 와인 가격 예측 - 1 개요 프로젝트 모델링 과정의 개요는 아래 그림과 같다. 우선 데이터에 대해 EDA와 전처리를 진행하고 파생변수를 생성했다. 그리고 전처리된 데이터로 모델링 과정을 진행하였다. 첫 번째로 모 jinhyunbae.tistory.com 모델링 앙상블(Ensemble) 모델 앙상블 모델이란 여러 개의 개별 모델을 조합하여 최적의 모델로 일반화하는 머신러닝 방법이다. 대표적인 방법으로는 배깅과 부스팅이 있다. 본 프로젝트에서는 배깅을 활용한 대표적인 알고리즘인 RandomForest의 Regression모델과 XGBoost의 Regression 모델을 사용하였다. RandomFores..
-
<심화 프로젝트> 와인 가격 예측 - 1내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 2. 21. 19:29
개요 프로젝트 모델링 과정의 개요는 아래 그림과 같다. 우선 데이터에 대해 EDA와 전처리를 진행하고 파생변수를 생성했다. 그리고 전처리된 데이터로 모델링 과정을 진행하였다. 첫 번째로 모델은 결측치를 삭제한 상태에서 모델을 학습하고 성능을 평가했으며 두 번째 모델은 머신러닝을 통해 결측치를 보간한 뒤 학습하여 성능을 평가했다. 세 번째는 두 번째 모델의 결측치 보간 데이터를 사용했으며 모델을 파생변수를 기준으로 둘로 나누어 각각 모델링하였다. 데이터 사용한 데이터는 Kaggle의 Wine Information이라는 데이터였다. 데이터는 한국의 웹사이트에서 얻어진 21605개의 와인 데이터이다. 출처 링크 : https://www.kaggle.com/datasets/dev7halo/wine-informa..
-
<기초 프로젝트> 고객 분석에 따른 마케팅 전략 제안 -2 (Customer Personality Analysis)내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 1. 19. 22:18
고객 분석에 따른 마케팅 전략 제안 -1 링크 : https://jinhyunbae.tistory.com/121 고객 분석에 따른 마케팅 전략 제안 -1 (Customer Personality Analysis) 프로젝트 명 : 고객 분석에 따른 마케팅 전략 제안 프로젝트 기간 : 2024.01.11 ~ 2024.01.18 사용된 데이터 : https://www.kaggle.com/datasets/imakash3011/customer-personality-analysis Customer Personality Analysis Analysis of compa jinhyunbae.tistory.com 분석 내용 결과 다음은 pymysql 라이브러리를 통해 불러온 쿼리 결과를 시각화한 결과 및 그래프이다. 세그먼..
-
<기초 프로젝트> 고객 분석에 따른 마케팅 전략 제안 -1 (Customer Personality Analysis)내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 1. 19. 22:17
프로젝트 명 : 고객 분석에 따른 마케팅 전략 제안 프로젝트 기간 : 2024.01.11 ~ 2024.01.18 사용된 데이터 : https://www.kaggle.com/datasets/imakash3011/customer-personality-analysis Customer Personality Analysis Analysis of company's ideal customers www.kaggle.com 기초프로젝트는 분석 도메인을 결정하고 결정하고 분석 도메인에서 SQL을 활용할 수 있는 데이터를 선정하여 SQL 쿼리를 다양하게 사용해보는 것을 중심으로 진행되었다. 요구사항은 2가지 SQL을 사용할 수 있는 데이터여야함 JOIN을 활용할 수 있도록 N개의 복수 데이터를 사용해야함. 우리 조는 마케팅..