ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • <TIL> 2023-12-14
    내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2023. 12. 14. 23:52

    내일배움캠프 사전학습캠프 사실상

    금요일은 일정이 있어서 사전캠프를 빠져야하기 때문에 사실상 오늘이 마지막 날

     

    스파르타코딩클럽 / 데이터 분석 종합반 4,5주차 수강

     

    인터넷에서 제공하는 코딩 강의들은 강의 초중반엔 콧노래 부르며 난나나 이런게 있어요 하면서 가르쳐주다가

    마지막 즈음되면 갑자기 어려운 내용 어려운 코드 와다다 쏟아내면서 마무리하는 경향이 있는 것 같다.

    응용 파트가 어려운건 맞지만 왜 항상 이런 패턴일까 ㅋㅋ

     

    배운 것 

      - 코호트 분석(Cohort Analysis)

      - 리텐션 분석(Retention Analysis)


     

    • 코호트 분석
      • 코호트란 동질한 집단을 의미함
      • 코호트 분석이란 동일한 기간 동안 공통된 특성이나 경험을 가진 사람들을 모아서 분석하는 것 

     

    • 리텐션 분석
      • 리텐션(유지율)은 제품의 첫 번째 사용 시점 이후 일정 기간이 지난 시점에 재품을 재사용하는 사용자의 비율
      • 재방문율, 잔존율과 동일하다고 생각하면 된다. 
      • 따라서 리텐션 분석에는 방문, 재방문의 기준이 될 특정행동을 정의해야 함

     

    코호트 분석과 리텐션 분석이 무엇인지 알기 전에는 두 개가 별도의 분석 방법론이라고 생각했는데 

    그런 것이 아니었다. 

     

     

    위의 그림은 5주차 내용으로 8월 1주차(31주차)부터 9월 2주차(36주차) 개강 강의의 코호트가 얼마나 5주차 완강까지

    잔존하는가에 대한 리텐션 차트이다. 세로축은 개강주차, 가로축은 강의의 주차이다

     

    8월 2주차부터 변경된 3주차 강의로인해 완주율이 오히려 떨어졌다라는 가설을 세우고 해당 리텐션 차트를 작성한 것이다.

     

    여기서 코호트는 개강일이 동일한 강의 수강자집단이고 리텐션 즉 재방문이란  다음 주차의 강의를 수강하는 것이다. 

     

    수강인원이 몇 주차 강의를 수강중인지를 강의 수강률을 통해 알아내고 개강주차, 강의수강 주차를 그룹으로 묶어서 집계테이블을 만들고 해당 집계테이블을 이용해서 히트맵을 그리는 것으로 리텐션 차트를 그릴 수 있었다.

     

    3주차 강의가 8월 2주차 부터 변경된 후 소폭 8월 2주차 개강 인원들과 3주차인원들이 수강률이 감소하긴했지만 4주차 인원과 9월 인원들을 보면 또 그런 경향을 확인할 수 없기 때문에

     

    강의의 변경으로 인해 완주율이 감소했다는 것은 차트로 확인하기가 어렵다

     

     

    앞선 차트가 전체에 비해 얼마나 잔존했는가를 의미한다면 위 차트는 바로 직전 주보다 얼마나 사람들이 많이 남았는가이다. 개강일 주차를 주차를 거듭할수록 조금씩 리텐션이 감소하고 있는 것을 확인할 수 있다. 

     

    머신러닝 모델 구축을 위한 데이터나 통계 처리를 위한 데이터 전처리만 해보았지 

    이러한 리텐션 차트를 만들기 위한 데이터 전처리는 처음해보는 일이었고 이런 전처리를 여러번 반복해서 익숙해질 필요가 있을 거 같다. 

     

    '내일배움캠프(데이터 분석 부트캠프 1기) > TIL & WIL' 카테고리의 다른 글

    <TIL> 2023-12-19  (0) 2023.12.19
    <TIL> 2023-12-18  (1) 2023.12.18
    <TIL> 2023-12-13  (0) 2023.12.13
    <TIL> 2023-12-12  (0) 2023.12.12
    <TIL> 2023-12-11  (1) 2023.12.11
Designed by Tistory.