목록TIL (10)
SQL & Python Study

🚨코드카타 슬럼프에 빠지게 만든 65-75번 문제 구간🚨그중 73번 문제. 입양 시각 구하기(2)을 통해 새로운 방식을 알게 되어 TIL로 기록해 보겠습니다. 처음에는 CASE WHEN 구문을 사용하여 0 ~ 24시에 해당하는 입양 건을 카운트하려고 했는데요. 쿼리가 너무 길어지고 비효율적이어서 '어.. 이게 아닌데..?' 싶더라구요. 그래서 다른 분들이 활용하신 SET문과 ROW_NUMBER()을 참고해서 풀었습니다. 1. SET문 변수 설정을 활용한 풀이SET @HOUR = -1; # 변수 선언 및 HOUR 초기 값 세팅SELECT @HOUR := @HOUR+1 AS `HOUR`, (SELECT COUNT(*) FROM ANIMAL_OUTS WHERE @HOUR = HO..

✏️ STUDY INDEX 01. 이동 평균 개념02. 이동 평균 관련 함수 및 구문 01. 이동 평균 개념 이동 평균(Moving Average)은 시계열 데이터의 노이즈를 줄이고 데이터의 패턴을 이해하는 데 사용되는 통계적 기법이다. 일정한 기간 동안의 데이터의 평균을 계산하여 각 시점에서의 값을 구합니다.이동 평균은 주로 다음과 같은 목적으로 사용됩니다.1. 데이터 스무딩: 시계열 데이터의 변동성을 줄여서 패턴을 더 명확하게 보기 위해 사용됩니다. 2. 추세 분석: 데이터의 장기적인 추세를 파악하는 데 사용됩니다. 3. 주식 및 금융 시장 분석: 주식 가격의 움직임을 분석하여 매수 및 매도 시점 결정에 도움을 줍니다.ChatGPT 이동평균'에 대한 답변 일부 발췌 (2024-05-29) 요약하..

📊 Hotel Booking 데이터 전처리 내용 1. 결측치 처리 : SQL에서 사용하기 위해 Na → Null 값으로 변경했어요. 2. 이상치 처리 : adr(평균 일일 요금) 에서 음수 값을 제거했습니다. 음수 데이터가 1건이라, 평균으로 대체하기 보다 제외하는 것을 택했어요. 이 외에 다른 이상치는 발견하지 못 했고, NULL 값은 '해당 없음'이라는 의미를 갖고 있어서 그대로 활용했습니다. 3. 고객 세그멘테이션 : 고객 구성별, 국적별, 예약 채널별(market segmentation)로 군집을 나누었어요. Hotel Booking 데이터에는 고객의 성별이나 연령대 등을 알 수 있는 데이터가 없었어요. 그래서 첫번째로 인원 및 아이 동반 여부에 따라서 고객 구성을 나누었고, 두 번째로 호텔 ..

✏️ STUDY INDEX 1. 코랩(colab)에 csv, excel 파일 불러오기 2. 라이브러리 소개 3. 리스트 컴프리헨션(List Comprehension)4. lambda 함수 1. 코랩(Colab)에 csv, excel, txt. 파일 불러오기지난 [D+9] 포스팅에서 코랩(colab)은 구글에서 제공하는 클라우드 기반 주피터 노트북 환경으로, 웹 상에서 파이썬을 실행할 수 있도록 지원한다고 소개드렸는데요. 오늘은 코랩에 다양한 포맷의 데이터 파일을 불러오는 방법을 알려드리려고 합니다. 나중에 캐글에서 프로젝트를 진행하실 때 필요할 수 도 있으니까요! 전 과제로 이번에 처음 배우고, 진행해 봤어요! STEP ① 구글 드라이브 마운트하기 먼저 [중요] 갖고 있는 데이터 파일을 구글 드라이브..

✏️ STUDY INDEX 1. 함수 정의 2. 변수와 인수 - 전역 변수 vs 지역 변수, 매개 변수 vs 인수, 키워드 인수 vs 위치 인수 - 기본 값 설정, 가변 인수 활용법 1. 함수 정의 함수는 변수를 입력받아 원하는 처리를 한 후 값을 내보내는 작업을 수행하는 역할을 해요. 즉, 특정 기능을 수행하기 위해 코드를 그룹화하여 재사용 가능한 형태로 정의한 것입니다. 그래서 재사용이 가능하며, 모듈화 할 수 있고 유지 보수가 용이하다는 장점이 있어요. 함수는 def 키워드를 활용하여 정의해요. def 함수명 (매개 변수1, 매개 변수 2 ...) : 수행할 작업 코드 return 결과값(예제) 리스트 합을 반환하는 함수 만들기#함수 정의def calculate (usr_lis..

✏️ STUDY INDEX1. 조건문 (if ~ elif ~ else)2. 반복문 - for 문 3. 반복문 - while문 1. 조건문 (if ~ elif ~ else)if 문은 특정 조건이 참(TRUE)인 경우에만 코드가 실행되는 구문으로, if, elif, else 로 구성되어 있고 구조는 아래와 같아요. 중요한 것은 파이썬은 들여쓰기도 하나의 문법이라서, 조건문 아래 들여 쓰기 꼭 해야 한다는 점 잊지 말아야 해요!✅ if 문 구조 if 조건 : true 일때 실행될 코드 elif 조건 : 다른 조건이 true 일때 실행될 코드 else : 위 조건이 모두 거짓일때 실행쾰 코드 조건문에서는 비교 및 논리 연산자를 사용할 수 있어요. 비교 연산자논리 연산자>, 초과, 미만and 모두 참일 ..

✏️ STUDY INDEX 1. Colaboratory 프로그램 설치 및 환경 세팅 2. Colab 핵심 단축키 3. 파이썬 주요 데이터 타입 총정리! 1. Colaboratory 프로그램 설치 및 환경 세팅파이썬(Python)은 간결하고 직관적인(즉, 가독성이 높은) 프로그래밍 언어예요. 코드 결과를 줄 단위로 수시로 확인할 수 있어 입문하기 쉬운 언어이기도 하고, 🔥데이터 분석, 시각화, 머신러닝 등에 사용할 수 있어 데이터 분석가에게 너무나 중요한 언어 🔥라고 합니다. 이런 파이썬을 웹 환경에서 구동할 수 있게 도와주는 것이 바로 구글 코랩 (Google Colab) 입니다!구글이 제공하는 무료 클라우드 기반 Jupyter 노트북 환경으로, 웹을 통해 파이썬 코드를 작성하고 실핼할 수 있..

✏️ STUDY INDEX 1. 데이터 리터러시란? 2. 데이터의 함정! 데이터와 관련된 4가지 오류3. 의미 있는 데이터 분석 첫걸음 문제 정의 4. 의미있는 데이터 분석 두 번째 걸음 지표 설정- Active user, Retention, Funnel, LTV, 북극성 지표 * 1주차 강의를 듣고 작성한 포스팅입니다. 1. 데이터 리터러시란?데이터 리터러시(Data Literacy)는 말 그대로 '데이터 문해력'입니다. 데이터를 읽고, 이해하고, 분석할 수 있는 능력입니다. 더 나아가, 분석한 결과를 의사소통에 활용하는 것까지가 데이터 리터러시라고 할 수 있어요! 데이터 분석을 하다보면 "데이터 결과"만을 맹신하는 경향이 있습니다.중요한 것은 눈 앞에 데이터에만 의존하지 않고① 스스로 목적과 ..

✏️ STUDY INDEX 1. 데이터 모델링의 이해 -- 정의, 목적, 특징, 데이터 모델링의 3단계, 3가지 관점, 중요성 2. 3층 스키마(3-Level Schema) -- 데이터 독립성, 3층 스키마의 구조별 특징 3. 데이터 모델링의 요소와 ERD -- 3가지 구성 요소(엔터티, 속성, 관계)와 ERD 작성법, 표기법 ※ 방대한 학습 내용을 요약하기 위한 포스팅으로 부연 설명이 없거나 매우 짧습니다. ※ 강의를 듣고 제 입맛대로 요약 & 재정리한 내용입니다. 1. 데이터 모델링의 이해 (0) 먼저 짚고 넘어가야할 가장 기본적인 개념 SQL(structured query language)데이터베이스에 직접적으로 액세스할 수 있는 언어.정의, 조작, 적용/취소, 제어, 처리 등 데이터베이스..

드디어 SQL 공부를 시작했습니다. [D+] 의미는 매일같이 공부한 내용을 올리겠다는 저의 작은 포부를 드러낸 거에요. 독학하시는 분들은 위 순서에 맞춰 글을 읽으신다면 개념 정리에 도움이 되지 않을까 싶어요. 거두절미하고 공부한 내용 복습이나 해볼게요. ✏️Study Index 1. Mysql 프로그램 설치 2. SQL 기본 개념과 데이터 조회하기 (SELECT, FROM) 3. 조건에 맞는 데이터 필터링하기 (WHERE) 4. 필터링에 유용한 표현 알아보기 (비교연산, BETWEEN, IN, LIKE) 1. Mysql 프로그램 설치 당연히 sql을 하려면 프로그램이 설치되어 있어야겠죠?데이터 분석을 도와주는 DBeaver Community 플랫폼에 들어가 본인의 OS에 맞는 프로그램을 설치해주시면 ..