์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- ๋จธ์ ๋ฌ๋
- ์ฝ๋์นดํ
- ๋ฐ์ดํฐ๋ถ์
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ
- ์ฝ๋ฉ
- ๋ง์ผํ
- ํ๋ก๊ทธ๋๋จธ์ค
- ํ์ด์ฌ
- TIL
- ์๋์ฐ ํจ์
- sqld
- ์บ๊ธ
- ๋ฐ์ดํฐ ๋ถ์
- ๋ ํ
- sql
- Today
- Total
๋ชฉ๋ก๐กPython (10)
SQL & Python Study

โ๏ธ STUDY INDEX 01. ๋ก์ง์คํฑ ํ๊ท (Logistic Regression) 02. ์ต๊ทผ์ ์ด์ (K-Nearest Neighbors, K-NN)03. ํ๊ฐ์งํ F1-score์ ํผ๋ํ๋ ฌ 01. ๋ก์ง์คํฑ ํ๊ท (Logistic Regression)์ด์ง ๋๋ ๋คํญ ๋ถ๋ฅ ๋ฌธ์ ํด๊ฒฐ์ ์ฃผ๋ก ์ฌ์ฉํ๋ ๋ถ์ ๊ธฐ๋ฒ*๋ฒ์ฃผ๊ฐ 2๊ฐ์ธ ๊ฒ (ex. ์คํธ ๋ฉ์ผ์ธ์ง ์๋์ง)๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ฒ์ฃผ์ ์ํ ํ๋ฅ ์ ์์ธก์ ํ ํ๊ท ๊ฒฐ๊ณผ๋ฅผ 0~1 ์ฌ์ด ๊ฐ์ผ๋ก ๋ฐํํ๋ ์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ ํ์ฉํ์ฌ ํ๋ฅ ๋ก ๋ฐํํ๋ ์๋ฆฌ.๋น์ฉ ํจ์๋ฅผ ์ต์ํํ์ฌ ๋ชจ๋ธ์ ์์ธก ์ฑ๋ฅ์ ๋์ด๋ ๊ฒ์ด ๋ชฉํ*๋น์ฉํจ์ : ๋ก์ง์คํฑ ํ๊ท ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ํ๊ฒ ๊ฐ ์ฌ์ด์ ์ฐจ์ด ๐ ํ์ด์ฌ ๋ก์ง์คํฑ ํ๊ท ๋ถ์ ๊ด๋ จ ํจ์sklearn.linear_mode..

โ๏ธ STUDY INDEX00. ๋จธ์ ๋ฌ๋์ ํ์ต ๋ฐฉ์ 01. ์ ํ ํ๊ท 02. ๋น์ ํ ํ๊ท(๋คํญ ํ๊ท) 03. ํ๊ท ๋ถ์ ํ๊ฐ์งํ - MSE, RMSE, R² โ ๋จธ์ ๋ฌ๋์ ๋ฐ์ดํฐ ํ์ต ๋ฐฉ๋ฒ์ 3๊ฐ์ง๋ก ๊ตฌ๋ถํ ์ ์์ด์. ์ด๋ฒ ํฌ์คํ ์ ์ง๋ ํ์ต์ ํด๋นํ๋ ํ๊ท ๋ถ์์ ๋ํ ๋ด์ฉ์ ๋๋ค. ์ง๋ ํ์ต (Supervised Learning) : ์ ๋ต์ด ์๋ ํ์ต. ์ฃผ์ด์ง ๋ฐ์ดํฐ(x)๋ฅผ ๋ฐํ์ผ๋ก ์ ๋ต(y)์ ์์ธกํ๋ ๊ฒ.ํ๊ท ๋ถ์ : ์์ธก๊ฐ(y)๊ฐ ์ฐ์ํ ๋ฐ์ดํฐ์ธ ๊ฒฝ์ฐ ๋ถ๋ฅ ๋ถ์ : ์์ธก๊ฐ(y)๊ฐ ์ด์ฐํ ๋ฐ์ดํฐ์ธ ๊ฒฝ์ฐ - ๋ฒ์ฃผํ ๋ฐ์ดํฐ, ์ด๋ฏธ์ง ๋ฑ์ ์ธ์ฝ๋ฉํ์ฌ ๋ถ์ํจ. ๋น์ง๋ ํ์ต (Unsupervised Learning) : ์ ๋ต์ด ์๋ ํ์ต. ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ํจํด์ด๋ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฒฌํ๋ ๊ฒ. ๊ตฐ์งํ(Clu..

โ๏ธ STUDY INDEX 01. ์์นํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ : ์ค์ผ์ผ๋ง(Scaling) - ํ์คํ(Standardization) - ์ ๊ทํ(Normalization) - ๋ก๋ฒ์คํธ ์ค์ผ์ผ๋ง(Robust Scaling) 02. ๋ฒ์ฃผํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ : ์ธ์ฝ๋ฉ(Encoding) - ๋ ์ด๋ธ ์ธ์ฝ๋ฉ(Label Encoding)- ์-ํซ ์ธ์ฝ๋ฉ(One-hot Encoding) 01. ์์นํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ : ์ค์ผ์ผ๋ง(Scaling)์ค์ผ์ผ๋ง(Scaling)์ ์์นํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐฉ์์ผ๋ก ๋ณ์์ ๋ฒ์(๋จ์) ๊ฐ์ ๋ง์ถฐ์ฃผ๋ ์์ ์ด์์. ๐ก์ค์ผ์ผ๋ง์ด ํ์ํ ์ด์ - ๋ณ์์ ํฌ๊ธฐ๊ฐ ๋ค๋ฅด๋ฉด ์ข ์ ๋ณ์(y) ์ ๋ฏธ์น๋ ์ํฅ์ ์ ๋๋ก ํ์ ํ๊ธฐ ์ด๋ ค์.- ํนํ, ๊ฐ์ค์น์ ๊ฐ ๊ฑฐ๋ฆฌ ๊ณ์ฐ ๊ธฐ๋ฐ์ ์๊ณ ๋ฆฌ์ฆ(ex. ๊ฒฝ์ฌํ๊ฐ๋ฒ, KNN)..

โ๏ธ STUDY INDEX 1. ํ์ผ ์ ์ฅ, ์ธ๋ฑ์ค, ์นผ๋ผ 2. ๋ฐ์ดํฐ ํ์ธํ๊ธฐ - head(), info() ๋ฑ 3. ๋ถ๋ฆฌ์ธ ์ธ๋ฑ์ฑ 4. ๋ฐ์ดํฐ ๋ณํฉ - concat(), merge()5. ๋ฐ์ดํฐ ์ง๊ณ - groupby(), pivot_table() 6. ๋ฐ์ดํฐ ์ ๋ ฌ - indexโป Visual Studio Code ๋ฅผ ์ฌ์ฉํ ๊ฐ์ ๋ณต์ต ํฌ์คํ ์ ๋๋ค. โป import pandas as pd๋ฅผ ๊ฐ์ ํ๊ณ ์์ฑํ ์ฝ๋์ ๋๋ค. 01. Pandas ํ์ผ ์ ์ฅ, ์ธ๋ฑ์ค, ์นผ๋ผ โ ๋ฐ์ดํฐ ํ์ผ ์ ์ฅํ๊ธฐ .to_csv() ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ํ์ ํ์ผ์ ์ ์ฅํ ๋ ์ฌ์ฉ์ธ๋ฑ์ค๋ฅผ ๋ณ๋๋ก ์ค์ ํด์ฃผ์ง ์์ผ๋ฉด, unnamed ์นผ๋ผ์ ์์ฑํ์ฌ ๋ฃ์ผ๋ฏ๋ก index = False๋ก ์ง์ ํด์ค์ผ ํจ. data_name.to..

โ๏ธ STUDY INDEX 1. ๋ฌธ์์ด์ ์ชผ๊ฐ ๋ฆฌ์คํธ๋ก ๋ฐํํ๋ .split( )2. ๊ฐ์ฒด์งํฅ ํ๋ก๊ทธ๋๋ฐ์ ํต์ฌ ๊ฐ๋ ํด๋์ค(class)3. ์กฐ๊ฑด์ ๋ฐ๋ผ ์์๋ฅผ ์ ํํ ์ ์๋ ๋ถ๋ฆฌ์ธ ์ธ๋ฑ์ฑ(Boolean indexing) 1. ๋ฌธ์์ด์ ์ชผ๊ฐ ๋ฆฌ์คํธ๋ก ๋ฐํํ๋ .split( ).split( ) ๋ฌธ์์ด์ ์ชผ๊ฐ ๋ฆฌ์คํธ๋ก ๋ฐํํด ์ฃผ๋ ๋ฉ์๋๋ก, ๊ดํธ ์์ ๊ฐ์ ๋ฌธ์์ด์ ๋๋๋ ๊ธฐ์ค์ด ๋ฉ๋๋ค. .split( ) ๊ณต๋ฐฑ์ ๊ธฐ์ค์ผ๋ก ๋ถํ .split( ',' ) ํน์ ๋ฌธ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ถํ .split( '\n' ) ์ค ๋จ์๋ก ๋ฌธ์์ด์ ๋ถํ ํด๋น ๋ฉ์๋๋ฅผ ํ์ฉํ์ฌ ์๋์ ๊ฐ์ ์์ ์ด ๊ฐ๋ฅํฉ๋๋ค. ์์๋๋ก ์์ ์ฝ๋๋ฅผ ์ง๋ณผ๊ฒ์. ๊ธฐ์ค์ ๋ฐ๋ผ ๋ถํ ๋ ๋ฌธ์์ด์ ํฉ์น๊ธฐ *.join() ํ์ฉํน์ ๋ฌธ์ ์ ์ธํ๊ธฐํน์ ๊ฐ์์ ํญ..

โ๏ธ STUDY INDEX 1. ์ฝ๋ฉ(colab)์ csv, excel ํ์ผ ๋ถ๋ฌ์ค๊ธฐ 2. ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์๊ฐ 3. ๋ฆฌ์คํธ ์ปดํ๋ฆฌํจ์ (List Comprehension)4. lambda ํจ์ 1. ์ฝ๋ฉ(Colab)์ csv, excel, txt. ํ์ผ ๋ถ๋ฌ์ค๊ธฐ์ง๋ [D+9] ํฌ์คํ ์์ ์ฝ๋ฉ(colab)์ ๊ตฌ๊ธ์์ ์ ๊ณตํ๋ ํด๋ผ์ฐ๋ ๊ธฐ๋ฐ ์ฃผํผํฐ ๋ ธํธ๋ถ ํ๊ฒฝ์ผ๋ก, ์น ์์์ ํ์ด์ฌ์ ์คํํ ์ ์๋๋ก ์ง์ํ๋ค๊ณ ์๊ฐ๋๋ ธ๋๋ฐ์. ์ค๋์ ์ฝ๋ฉ์ ๋ค์ํ ํฌ๋งท์ ๋ฐ์ดํฐ ํ์ผ์ ๋ถ๋ฌ์ค๋ ๋ฐฉ๋ฒ์ ์๋ ค๋๋ฆฌ๋ ค๊ณ ํฉ๋๋ค. ๋์ค์ ์บ๊ธ์์ ํ๋ก์ ํธ๋ฅผ ์งํํ์ค ๋ ํ์ํ ์ ๋ ์์ผ๋๊น์! ์ ๊ณผ์ ๋ก ์ด๋ฒ์ ์ฒ์ ๋ฐฐ์ฐ๊ณ , ์งํํด ๋ดค์ด์! STEP โ ๊ตฌ๊ธ ๋๋ผ์ด๋ธ ๋ง์ดํธํ๊ธฐ ๋จผ์ [์ค์] ๊ฐ๊ณ ์๋ ๋ฐ์ดํฐ ํ์ผ์ ๊ตฌ๊ธ ๋๋ผ์ด๋ธ..

โ๏ธ STUDY INDEX 1. ํจ์ ์ ์ 2. ๋ณ์์ ์ธ์ - ์ ์ญ ๋ณ์ vs ์ง์ญ ๋ณ์, ๋งค๊ฐ ๋ณ์ vs ์ธ์, ํค์๋ ์ธ์ vs ์์น ์ธ์ - ๊ธฐ๋ณธ ๊ฐ ์ค์ , ๊ฐ๋ณ ์ธ์ ํ์ฉ๋ฒ 1. ํจ์ ์ ์ ํจ์๋ ๋ณ์๋ฅผ ์ ๋ ฅ๋ฐ์ ์ํ๋ ์ฒ๋ฆฌ๋ฅผ ํ ํ ๊ฐ์ ๋ด๋ณด๋ด๋ ์์ ์ ์ํํ๋ ์ญํ ์ ํด์. ์ฆ, ํน์ ๊ธฐ๋ฅ์ ์ํํ๊ธฐ ์ํด ์ฝ๋๋ฅผ ๊ทธ๋ฃนํํ์ฌ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ํํ๋ก ์ ์ํ ๊ฒ์ ๋๋ค. ๊ทธ๋์ ์ฌ์ฌ์ฉ์ด ๊ฐ๋ฅํ๋ฉฐ, ๋ชจ๋ํ ํ ์ ์๊ณ ์ ์ง ๋ณด์๊ฐ ์ฉ์ดํ๋ค๋ ์ฅ์ ์ด ์์ด์. ํจ์๋ def ํค์๋๋ฅผ ํ์ฉํ์ฌ ์ ์ํด์. def ํจ์๋ช (๋งค๊ฐ ๋ณ์1, ๋งค๊ฐ ๋ณ์ 2 ...) : ์ํํ ์์ ์ฝ๋ return ๊ฒฐ๊ณผ๊ฐ(์์ ) ๋ฆฌ์คํธ ํฉ์ ๋ฐํํ๋ ํจ์ ๋ง๋ค๊ธฐ#ํจ์ ์ ์def calculate (usr_lis..

โ๏ธ STUDY INDEX1. ์กฐ๊ฑด๋ฌธ (if ~ elif ~ else)2. ๋ฐ๋ณต๋ฌธ - for ๋ฌธ 3. ๋ฐ๋ณต๋ฌธ - while๋ฌธ 1. ์กฐ๊ฑด๋ฌธ (if ~ elif ~ else)if ๋ฌธ์ ํน์ ์กฐ๊ฑด์ด ์ฐธ(TRUE)์ธ ๊ฒฝ์ฐ์๋ง ์ฝ๋๊ฐ ์คํ๋๋ ๊ตฌ๋ฌธ์ผ๋ก, if, elif, else ๋ก ๊ตฌ์ฑ๋์ด ์๊ณ ๊ตฌ์กฐ๋ ์๋์ ๊ฐ์์. ์ค์ํ ๊ฒ์ ํ์ด์ฌ์ ๋ค์ฌ์ฐ๊ธฐ๋ ํ๋์ ๋ฌธ๋ฒ์ด๋ผ์, ์กฐ๊ฑด๋ฌธ ์๋ ๋ค์ฌ ์ฐ๊ธฐ ๊ผญ ํด์ผ ํ๋ค๋ ์ ์์ง ๋ง์์ผ ํด์!โ if ๋ฌธ ๊ตฌ์กฐ if ์กฐ๊ฑด : true ์ผ๋ ์คํ๋ ์ฝ๋ elif ์กฐ๊ฑด : ๋ค๋ฅธ ์กฐ๊ฑด์ด true ์ผ๋ ์คํ๋ ์ฝ๋ else : ์ ์กฐ๊ฑด์ด ๋ชจ๋ ๊ฑฐ์ง์ผ๋ ์คํ์พฐ ์ฝ๋ ์กฐ๊ฑด๋ฌธ์์๋ ๋น๊ต ๋ฐ ๋ ผ๋ฆฌ ์ฐ์ฐ์๋ฅผ ์ฌ์ฉํ ์ ์์ด์. ๋น๊ต ์ฐ์ฐ์๋ ผ๋ฆฌ ์ฐ์ฐ์>, ์ด๊ณผ, ๋ฏธ๋งand ๋ชจ๋ ์ฐธ์ผ ..

โ๏ธ STUDY INDEX 1. ๋ฆฌ์คํธ(list) ์ฌ์ฉ๋ฒ 2. ํํ(tuple) ์ฌ์ฉ๋ฒ 3. ๋์ ๋๋ฆฌ(dictionary) ์ฌ์ฉ๋ฒ ์ค๋์ ํ์ด์ฌ์ ์๋ฃ ์ ํ์ธ ๋ฆฌ์คํธ, ํํ, ๋์ ๋๋ฆฌ์ ๋ํด์ ๊ณต๋ถํ ๋ด์ฉ์ ์ ๋ฆฌํ๋ ค๊ณ ํด์. ๋ง์ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์กฐํํ๊ณ ๊ฐ๊ณต, ์กฐ์ํ๋ ๋ฐ์ ํ์ํ๊ธฐ ๋๋ฌธ์ ๋งค์ฐ ์ค์ํ ๊ฐ๋ ์ด์์. ์ธ๋ถ์ ์ธ ๋ด์ฉ์ ์ ๋ฆฌํ๊ธฐ ์์, ํต์ฌ ๊ฐ๋ ๋ง ๋จผ์ ์์ฝํด ๋ดค์ต๋๋ค. ๐ ๋ฆฌ์คํธ, ํํ, ๋์ ๋๋ฆฌ ๊ฐ๋ ์ ๋ฆฌ ๋ฆฌ์คํธ [ list ]ํํ ( tuple )๋์ ๋๋ฆฌ { dictionary }๊ธฐ๋ณธ ๊ตฌ์กฐ [ ] ๋๊ดํธ ์ฌ์ฉ my_list = [1, 2, 3, 4]( ) ์๊ดํธ ์ฌ์ฉ my_tuple = (1, 2, 'sql'){ } ์ค๊ดํธ ์ฌ์ฉ my_dict = { 'key' : 'value..

โ๏ธ STUDY INDEX 1. Colaboratory ํ๋ก๊ทธ๋จ ์ค์น ๋ฐ ํ๊ฒฝ ์ธํ 2. Colab ํต์ฌ ๋จ์ถํค 3. ํ์ด์ฌ ์ฃผ์ ๋ฐ์ดํฐ ํ์ ์ด์ ๋ฆฌ! 1. Colaboratory ํ๋ก๊ทธ๋จ ์ค์น ๋ฐ ํ๊ฒฝ ์ธํ ํ์ด์ฌ(Python)์ ๊ฐ๊ฒฐํ๊ณ ์ง๊ด์ ์ธ(์ฆ, ๊ฐ๋ ์ฑ์ด ๋์) ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์์. ์ฝ๋ ๊ฒฐ๊ณผ๋ฅผ ์ค ๋จ์๋ก ์์๋ก ํ์ธํ ์ ์์ด ์ ๋ฌธํ๊ธฐ ์ฌ์ด ์ธ์ด์ด๊ธฐ๋ ํ๊ณ , ๐ฅ๋ฐ์ดํฐ ๋ถ์, ์๊ฐํ, ๋จธ์ ๋ฌ๋ ๋ฑ์ ์ฌ์ฉํ ์ ์์ด ๋ฐ์ดํฐ ๋ถ์๊ฐ์๊ฒ ๋๋ฌด๋ ์ค์ํ ์ธ์ด ๐ฅ๋ผ๊ณ ํฉ๋๋ค. ์ด๋ฐ ํ์ด์ฌ์ ์น ํ๊ฒฝ์์ ๊ตฌ๋ํ ์ ์๊ฒ ๋์์ฃผ๋ ๊ฒ์ด ๋ฐ๋ก ๊ตฌ๊ธ ์ฝ๋ฉ (Google Colab) ์ ๋๋ค!๊ตฌ๊ธ์ด ์ ๊ณตํ๋ ๋ฌด๋ฃ ํด๋ผ์ฐ๋ ๊ธฐ๋ฐ Jupyter ๋ ธํธ๋ถ ํ๊ฒฝ์ผ๋ก, ์น์ ํตํด ํ์ด์ฌ ์ฝ๋๋ฅผ ์์ฑํ๊ณ ์คํผํ ์ ์..