배또가또 2024. 2. 15. 23:17
  • 오늘 진행한 일 
    • 팀 프로젝트 데이터 재 전처리
    • 팀 프로젝트 머신러닝 모델링

다음주 월요일에 있을 발표를 준비하기 위해 오늘부터는 PPT 작성에 들어갔다. 

조원들이 PPT 만드는 걸 도우면서 대부분의 시간을 보냈고

 

그와 동시에 조금 더 다양한 모델을 만들어서 기존에 만든 모델과 성능비교를 해보고 싶어

모델을 여러개 구축하였다.

 

따로 결측치 데이터를 보간하지 않고 전부 날려버리고 남은

데이터만 가지고 분석하는 모델을 하나 더 구축했고 

구세계 와인과 신세계 와인을 따로 나누어 각각 예측 모델을 만들기도 했다. 

 

각각의 모델은 모두 Optuna로 하이퍼 파라미터 튜닝을 해주었다. 

 

결과만 놓고 봤을 땐 이때까지 만들었던 모델 중에서 결측치를 전부 없앤 뒤 구축한 모델이 

가장 성능이 좋았으나 그 마저도 좋은 성능을 갖고 있다고 말하기는 어려웠다. 

 

내일은 SHAP을 이용해서 변수 중요도와 변수가 값에 미친 영향을 시각화하는 과정을 해보고자한다.