전체 글
-
데이터 리터러시(Data Literacy) -2데이터 분석 관련 공부 2024. 1. 3. 19:52
본 블로그는 스파르타의 데이터 리터러시 강의를 듣고 간략하게 정리한 것이다.) 데이터 리터러시(Data Literacy) -1 (본 블로그는 스파르타의 데이터 리터러시 강의를 듣고 간략하게 정리한 것이다.) 데이터 리터러시(Data Literacy) 데이터 리터러시의 정의 데이터를 읽는 능력 데이터를 이해하는 능력 데이터를 비 jinhyunbae.tistory.com 데이터 유형 정량적 데이터 수치로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있음 데이터가 숫자 형태로 존재하기 때문에 통계 분석이 용이함 개인의 해석이나 주관이 적게 작용하는 객관성을 가짐 지표로 만들기 용이함 수치형 설문조사, 인구 통계, 비즈니스 데이터, 마케팅 데이터, 로그 데이터 등이 있음 정성적 데이터 비수치적 정보로 사..
-
데이터 리터러시(Data Literacy) -1데이터 분석 관련 공부 2024. 1. 3. 15:00
(본 블로그는 스파르타의 데이터 리터러시 강의를 듣고 간략하게 정리한 것이다.) 데이터 리터러시(Data Literacy) 데이터 리터러시의 정의 데이터를 읽는 능력 데이터를 이해하는 능력 데이터를 비판적으로 분석하는 능력 결과를 의사소통에 활용할 수 있는 능력 데이터 리터러시란 데이터 수집과 원천을 이해하고 데이터에 대한 활용법을 이해하며, 데이터를 통한 핵심 지표를 이해하는 것이다. 데이터 분석가가 갖추어야할 중요한 소프트 스킬이다. 데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어준다 데이터 분석 오류 데이터 리터러시 문제로 인해 데이터 분석에서 오류를 범하는 경우가 많다. 대표적인 오류 사례는 다음과 같다. 1. 심슨의 역설(Simpson's Paradox) 부분에서 성립한 대소 관계가 부분..
-
<TIL> 2024-01-02내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2024. 1. 2. 21:03
내일배움캠프 본 캠프 10일차 TIL 작성 2024년 새해 첫 학습일지 오늘 학습한 것 내일배움캠프 SQL 개인과제 문제 정현석 튜터님 SQL 특강 지난 주 금요일에 개인과제를 다 완료하지 못해서 오늘 마저 다 풀게 되었다. 오늘 애를 먹었던 문제는 아래 사진의 문제이다. 우선 테이블이 3개가 있고 3개의 테이블을 통해서 조회해야하는 문제 요구사항은 다음과 같다. 각 주(State)별로 주문의 총 금액(Amount)을 계산 각 주(State)별로 주문의 총 이익(Profit)을 계산 각 주(State)내에서 주문의 매출 순위를 결정 각 주(State)내에서 주문의 총 금액이 해당 카테고리의 평균 매출 목표의 50%를 달성했는지의 여부를 판단 우선 조회해야하는 데이터가 그룹을 지을 것을 요구하는데 각 요구..
-
<WIL> 2023년 12월 4주차 회고내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2023. 12. 29. 21:57
내일배움캠프 본 캠프 2023년 마지막 주인 12월 4주차도 끝이 났다. 이번 주는 SQL기초 및 심화 주차로 진행되었다. 스파르타에서 제공해준 엑셀보다 쉽고 빠른 SQL 강의를 다시 복습했고 SQLD를 취득하긴했지만 이론 복습과 Oracle 쿼리 학습을 위해 SQLD 강의도 수강을 했다. 그리고 지난 주와 동일하게 SQL 코드카타(코딩테스트) 문제를 하루에 3~4문제씩 매일 풀면서 문제 코드와 코드에 대한 해설을 블로그에 기록했다. SQL 코드카타를 60문제 이상 풀고나니 이제 남아있는 문제는 난이도가 조금 있는 문제들이라 한 문제 한 문제 풀 때 고민을 많이 하고있어서 시간은 오래 걸리지만 더 배워가는 것들이 있어서 좋았다. 그리고 대망의 연말, 새해 3일 연휴 직전인 금요일 오늘 SQL 개인과제가 ..
-
<TIL> 2023-12-29내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2023. 12. 29. 21:36
내일배움캠프 본 캠프 9일차 TIL 작성 2024년 새해 전 마지막 학습일지 오늘 학습한 것 내일배움캠프 SQL 개인과제 문제 CLV(고객 평생 가치) SQL 개인과제 문제를 풀다가 알게 된 것 정제된 코딩테스트의 데이터를 다루는 것과 정제되지 않은 raw 데이터를 다루는 것은 확실하게 다르다. 비정제 데이터를 쿼리로 다루는 경험이 필요하다. 개인과제 개인과제를 시작하기 위해 데이터를 MySQL localhost에 저장하고 불러 온 뒤 딱 첫 문제를 푸는데 오류와 맞닥뜨렸다. 날짜 데이터 형식에 관련한 문제였다. 데이터 형식은 dd-mm-yyyy였는데 yyyy-mm-dd형식이었다면 string형태라도 대소비교가 됐겠지만 datetime형태로 바꿔주어야할 것 같아서 기계적으로 DATE_FORMAT() 함수..
-
<TIL> 2023-12-28내일배움캠프(데이터 분석 부트캠프 1기)/TIL & WIL 2023. 12. 28. 21:48
내일배움캠프 본 캠프 8일차 TIL 작성 오늘 학습한 것 SQLD 자격증 대비반 강의 3주차 강의 수강 SQL 코드카타 다소 어려운 SQL 문제를 풀다보니 하루에 많은 문제를 풀기는 쉽지 않지만 한 문제 문제 마다 배울 점들 새롭게 알게되는 것들을 발견하고 있다. 어제 WITH문과 WITH RECURSIVE문을 알게 되었고 그래서 오늘 해당 부분을 활용하여 코딩테스트를 풀었다. 서브쿼리로 하면 다소 문장이 복잡해보이던 것들이 WITH문을 이용하니 조금 더 간결하게 문제를 풀 수는 있었다. 문제 링크 : https://leetcode.com/problems/average-time-of-process-per-machine/ Average Time of Process per Machine - LeetCode ..
-
<프로그래머스> 저자 별 카테고리 별 매출액 집계하기코딩테스트/SQL 코딩테스트 2023. 12. 28. 20:29
출처 : https://school.programmers.co.kr/learn/courses/30/lessons/144856 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 요구사항 2022년 1월의 도서판매량 데이터를 기준으로 저자 별, 카테고리별 매출액(TOTAL_SALES = 판매량 * 판매가)를 구하여 저자ID, 저자명, 카테고리, 매출액 리스트를 출력하는 SQL작성 결과는 저자ID를 오름차순으로 정렬, 저자가 같다면 카테고리를 내림차순 정렬 테이블이 BOOK, AUTHOR, BOOK_SALES 테이블이 있는데 이 때 BOOK_SALES는 BO..
-
<프로그래머스> 주문량이 많은 아이스크림 조회하기코딩테스트/SQL 코딩테스트 2023. 12. 28. 19:55
출처 : https://school.programmers.co.kr/learn/courses/30/lessons/133027 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 요구사항 7월에 아이스크림 총 주문량과 상반기 아이스크림 총 주문량을 더한 값이 큰 순서대로 상위 3개의 맛을 조회하는 SQL문을 작성 FIRST_HALF테이블은 이미 집계가 된 테이블이고 JULY 테이블은 집계되지 않은 데이터이다. 따라서 두 가지 접근이 가능하다고 봤다. 첫번째는 JULY 테이블을 집계처리를 한 뒤 내부 조인을 하는 것이다. 두 번째는 외부 조인을 해서 데이터를..