내일배움캠프(데이터 분석 부트캠프 1기)
-
<TIL> 2024-03-21내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 21. 22:44
오늘 진행한 일 개인 프로젝트 대시보드 작성 A/B 테스트 관련 내용 검색 및 학습 SQL 코드테스트 https://jinhyunbae.tistory.com/168 2024-02-28 오늘 진행한 일 SQL 코딩 테스트 개인 프로젝트 (통계 분석) 하루 루틴인 SQL 코딩테스트 3문제를 클리어한 뒤 개인 프로젝트 데이터에 대한 전처리 및 통계분석을 실시했다. 우선 어제 EDA를 해본 jinhyunbae.tistory.com 한 달 전쯤 프로젝트를 시작하기 전에 개인 프로젝트 용으로 찾아놨던 데이터에 대해서 간단하게 EDA를 하고 전처리 한 뒤 통계 분석까지 했던 것을 이제 대시보드화 하기 위해서 다시 훑어보기 시작했다. https://medium.com/bondata/a-b-%ED%85%8C%EC%8A%..
-
<TIL> 2024-03-20내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 20. 22:03
오늘 진행한 일 최종 팀프로젝트 대비 데이터 탐색 스파르타 수준별 학습(태블로) 강의 수강 실전 프로젝트 팀원과 지속적으로 최종 팀프로젝트를 대비한 데이터를 탐색하고 있고 튜터님께도 질문을 많이 드리고 있는 중이다. 많은 튜터님들께서 크롤링을 통한 데이터 분석을 많이 추천해주셨는데 약간의 고민이 되는 부분은 크롤링을 통해서 데이터를 구한다고 했을 때 서비스, 프로덕트 분석에서 많이 사용하는 AARRR 퍼널분석, 코호트, 리텐션에 관한 분석이 어려울 것 같다는 부분 때문이다. 그리고 kaggle에서 데이터를 구한다고 했을 때는 JD와 도메인에 맞는 분석에 초점을 맞춰야 하는데 그렇다면 어떠한 분석을 해야하는가이다. 미래에 지원할 회사에서 적용할 수 있을 법한 프로젝트를 수행하는게 좋겠다는 조언을 받았기 때..
-
<TIL> 2024-03-18내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 18. 23:47
오늘 진행한 일 Spark 강의 수강 최종 팀프로젝트 대비 데이터 탐색 오늘은 강의를 수강하며 알게된 파이썬 코드에 대한 내용을 기록한다. 메소드 체이닝과 리스트 컴프리헨션에 대해서 배웠는데 메소드 체이닝은 자주 사용하던 개념이었는데 이름을 모르고 그냥 동작하니까 사용했던 코드였다. 리스트 컴프리헨션은 종종 코드를 인터넷에서 볼 때 발견하던 양식의 코드였는데 조금 이해하기 난해해서 잘 사용하지 않았던 코드였다. 이번에 제대로 배워서 여러 줄의 코드를 짧고 간결하게 작성해보는 경험을 했다. 메소드 체이닝(Method chaining) 메소드 체이닝이란 여러 메소드를 이어서 호출하는 문법임 메소드 체이닝을 이용하면 코드가 하나의 문장처럼 읽히게 할 수 있다는 장점이 있고 코드가 간결해진다는 장점이 있음 그러..
-
<WIL> 2024년 3월 둘째 주 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 15. 21:54
2024년 3월 둘째 주 회고 지난 주 열심히 했던 실전 프로젝트가 이번 주 화요일 발표로 마무리가 되었다. 이번 한 주를 돌아보면 발표 이후로 조금 뒷심이 빠졌던 것 같다. 국민 취업제도 관련 상담, F&B 태블로 신병 훈련소 교육, Spark 강의 수강, 개인 프로젝트 해야할 것은 참 많았는데 원하는 만큼 열심히 하지는 못했던 한 주였다. 지난 주부터 주말 내내 열심히 달렸던 반동 때문인지 엄청난 피로감이 요 며칠 동안 밀려들었다. 잠을 자도 뭔가 회복이 잘 되지 않았고 그래서 계속 졸리고 기운없는 상태가 반복되었다. 이 때까지 계속 잠을 줄여서 컨디션 관리에 소홀했기 때문이라고 생각이 들었다. 취준이라는 마라톤을 하는 과정에서 너무 건강을 등한시 했던 것은 아닌가 하는 생각이 들어서 조금 더 규칙적..
-
<TIL> 2024-03-15내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 15. 21:50
오늘 진행한 일 Spark 강의 수강 채용공고 및 JD 탐색 어제자 Spark 강의와 마찬가지로 Spark 사용 이전 단계에서 Spark를 다루지 않고 대용량 데이터를 처리하는 방법에 대해서 배웠다. 그 방법은 샘플링과 분할처리였다. 샘플링 기법에 대해서는 머신러닝을 하면서 어느 정도 알고 있는 부분이라고 생각했는데 강의를 들으면서 새롭게 안 사실들이 꽤 있었다. 대용량 파일을 Spark를 쓰지 않고 처리하는 방법 Sampling 전체 데이터가 많아서 분석이 어렵다면 일부 데이터만 분석하는 방법을 사용할 수 있다. 모델을 개발할 때만 샘플링을 하는 방법도 있고, 데이터가 넉넉하면 일부 데이터 분석으로 충분할 수도 있다. Random Sampling 랜덤 샘플링은 말 그대로 랜덤으로 데이터를 추출한 방법으..
-
<TIL> 2024-03-14내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 14. 23:47
오늘 진행한 일 학습 주차 팀빌딩 Spark 강의 수강 그저께 까지는 실전 프로젝트 조와 프로젝트를 진행하였고 어제는 인터넷 관련 문제를 해결하고 국민 취업 지원제도 관련 상담도 받고 팀 프로젝트 회고를 진행하는 등 정신없는 하루들을 보냈다. 그래서 신청했던 F&B 태블로 신병 훈련소 과정이 4일차에 접어들었는데도 아직 한 문제도 풀어보질 못하였다. 그래도 과제 제출은 3월 20일까지니까 주말까지 활용하여 과제를 제출하고자한다. F&B를 위한 태블로 신병훈련소 2024.03 F&B를 위한 태블로 신병훈련소 2024.03 www.salesforce.com 오늘은 최종 프로젝트 전에 진행될 학습 주차에서의 조 편성이 있었다. 팀프로젝트를 함께하는 조는 아니기 때문에 간단한 자기소개를 나누는 시간을 가지고 오..
-
실전 프로젝트 KPT 회고내일배움캠프(데이터 분석 부트캠프 1기)/팀프로젝트 2024. 3. 13. 12:19
KPT회고 - 프로젝트 기간 : 2024.03.01 ~ 2024.03. 12 - 조 이름 : 데이터 몬스터(A03) - 조원 : 권재혁, 김승연, 배진현(나), 이태림 Keep : 잘하고 있으며 앞으로도 지속 했으면 좋겠겠다고 생각하는 점. Problem : 문제가 있으며 변화가 필요한 점. Try : 잘하고 있는 것을 더 잘하기 위해서, 문제가 있는 점을 해결하기 위해서 우리가 시도해 볼 것들 Keep : 팀원들과 지속적으로 소통함. 화기애애한 분위기가 힘든 과제를 하는 중에 많은 도움이 되었다고 생각함. Problem : 조금 욕심을 부려서 프로젝트의 판을 키워버렸는데 이 부분도 처음부터 계획에 넣어서 진행했으면 좋았을 것 같다고 생각함. 도중에 갑자기 커진 판을 감당하려다가 발표 직전까지 눈물의 태..
-
<WIL> 2024년 3월 첫째 주 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 3. 8. 21:19
2024년 3월 첫째 주 회고 팀 프로젝트가 본격적으로 시작되고 상당히 도전적인 과제를 선정하여서 데이터를 전처리하는데에 대부분의 시간을 할애하게 되었다. 파이썬으로 필요한 전처리를 거의 다 끝내버리고 난 뒤에 대시보드 작업에 들어가서 생각보다 빠르게 작성을 끝낼 수는 있었지만 다른 조의 대시보드 퀄리티를 보았을 땐 전처리에 들이는 공을 좀 줄이고 대시보드를 작업해야 했었던 것은 아닌가하는 생각이 든다. 근데 이번에 우리가 선택한 과제가 데이터의 정합성에 대한 대시보드를 만드는 것이라 게임이나 마케팅 관련한 현황 대시보드들에 비해서 보여줄 수 있는 차트의 다양성이 적어서 그랬던 것도 한 몫하는 것 같다. 정합성에 관한 대시보드도 충분히 경쟁력이 있는 포폴이 되겠지만 메인 포트폴리오로 가져가기는 좀 어려울..