-
<TIL> 2024-02-26내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 2. 26. 22:18
- 오늘 진행한 일
- SQL 코딩 테스트
- Tableu 개인과제
오늘 오전에는 해커랭크의 SQL 코딩테스트 문제를 풀었고
오후 시간은 주말부터 조금씩 진행했던 Tableu 개인과제 문제를 끝까지 풀었다.
대시보드 제작에 사용된 데이터는 A/B test와 관련된 데이터였다.
https://www.kaggle.com/datasets/zhangluyuan/ab-testing
개인과제 문제는 총 워크시트를 7개 만드는 것으로
문제의 요구사항은 아래와 같았다.
- 난이도 하
- 워크시트 1번: 그룹별 유저 비중 파이 차트 시각화
- 워크시트 2번: 그룹별 평균 전환율 막대 그래프 시각화
- 워크시트 3번: 일별 그룹별 평균 전환율 선 그래프 시각화
- 워크시트 4번: 그룹별 유저 고유 카운트 요일별 캘린더 차트 만들기
- 난이도 중
- 워크시트 5번(대시보드 불포함): 데이터 정합성 체크 & 전처리 작업(대시보드 적용)
- 워크시트 6번: 도넛 차트 활용 평균 전환율 지표 카드 만들기
- 워크시트 7번: start date와 end date 매개변수 필터 만들기(대시보드 적용)
- 난이도 상
- 워크시트 8번: t-test 텍스트 표시
난이도 중까지는 어렵지 않게 풀 수 있었으나.
난이도 상은 상당한 시간이 소요되었다.
t-test를 태블로에서 사용하기위해서 tabpy라는 라이브러리를 찾아서 연동해보려고 했으나
튜터님께 문의해본 결과 제공해준 태블로 클라우드 환경에서는 사용할 수 없다는 답변을 받았다.
이 과정에서 t 검정에 대해서 좀 더 자세히 공부하는 시간이 되었다.
t 통계량 값을 계산하는 데는 아래의 링크를 참고하였다.
https://angeloyeo.github.io/2020/02/13/Students_t_test.html
결국 계산식을 통해 하나하나 계산하는 것으로 t통계량과 p-value를 구할 수 있었다.
익숙하지 않은 툴을 가지고 여러 그래프를 그리고 배치하려고 하다보니 버벅이게 되어서
간단한 것 하나를 진행하는데도 시간이 꽤 소요되었다.
사실 워크시트에 들어갈 그래프를 만드는 것 자체보다도
색 구성을 어떻게 할 것인지 대시보드의 레이아웃을 어떻게 할 것 인지 등
디자인이나 설계 측면에서 더 많은 시간이 걸렸다.
그래도 목표로한 시간 안에 대시보드를 완성시킬 수 있었다.
완성된 대시보드는 아래 스크린샷으로 남겨두었다.
대시보드의 자세한 작성 과정은
블로그의 개인과제 탭에 자세히 남길 예정이다.
과제 제출은 수요일 오후 4시까지인데 예상보다 조금 빠르게 과제를 마무리했기 때문에
개인과제 내용을 figma를 활용하여 좀 더 발전시킬지 아니면 아예 새로운 대시보드를 직접
처음부터 다시 짜보는 과정을 figma를 이용해서 할 것인지를 고민하고 있다.
아무래도 후자 쪽이 좀 더 도전적인 목표가 될 것 같은데 그만큼의 시간적 여유가 있을진 모르겠다.
'내일배움캠프(데이터 분석 부트캠프 1기) > TIL & WIL' 카테고리의 다른 글
<TIL> 2024-02-28 (0) 2024.02.28 <TIL> 2024-02-27 (2) 2024.02.28 <WIL> 2024년 2월 4주차 회고 (0) 2024.02.23 <TIL> 2024-02-23 (0) 2024.02.23 <TIL> 2024-02-22 (0) 2024.02.22 - 오늘 진행한 일