์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- TIL
- ๋ ํ
- ์ฝ๋์นดํ
- ์ฝ๋ฉ
- ํ๋ก๊ทธ๋๋จธ์ค
- sql
- ์บ๊ธ
- ๋ฐ์ดํฐ๋ถ์
- ๋ง์ผํ
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ
- sqld
- ๋จธ์ ๋ฌ๋
- ํ์ด์ฌ
- ์๋์ฐ ํจ์
- ๋ฐ์ดํฐ ๋ถ์
- Today
- Total
๋ชฉ๋ก๐ตโ๏ธTeam Project (5)
SQL & Python Study

๐ INDEX 01. ๊ฒฝ๊ธฐ ์๊ฐ๋ณ ์๊ด๊ณ์ ๋ถ์ 02. ๊ฒฝ๊ธฐ ์๊ฐ๋ณ ์ค๋ธ์ ํธ, ํฌ/๋ฐ์ค, ๊ณจ๋ ํ๋ ์ถ์ด03. ์นํจ ์ง๋จ๋ณ ๊ฐ ์์ธ ์ฐจ์ด ๋น๊ต๐๐ปโ๏ธ ์ฎ์'s comment"์ฒซ์งธ ๋ ๋ด๋นํ๋ ์ค๋ธ์ ํธ์ ์น๋ฆฌ ์์ธ ๋ถ์์ ๋ ๊น๊ฒ ๋ค์ด๊ฐ๋ดค์ต๋๋ค! ๋ค์ ํน์ดํ ์์์ ๋ณด์ฌ์ฃผ์๋ 900์ด ๋ฏธ๋ง ํ๋ ์ด๋ฅผ ๋น๋กฏํด [ 15๋ถ ๋ฏธ๋ง / 15๋ถ ์ด์ ~ 25๋ถ ๋ฏธ๋ง / 25๋ถ ์ด์ ~ 35๋ถ ๋ฏธ๋ง / 35๋ถ ์ด์ ] 4๊ฐ๋ก ๋ฐ์ดํฐ๋ฅผ ๋๋์ด, ๊ฒฝ๊ธฐ ์๊ฐ ๋ณ๋ก ์น๋ฆฌ ์์ธ์ด ์ด๋ป๊ฒ ๋ฐ๋๋์ง ๋ถ์ํด๋ดค์ต๋๋ค." ๐ LOL ์ฌ์ ์ง์ (= ๊ฒฝ๊ธฐ ์๊ฐ์ ๋ฐ๋ผ ์ง๋จ์ ๋๋์ด์ ๋ถ์ํ๋์ง)๋ฐ์ดํฐ๋ฅผ EDA ํด๋ณด์์ ๋ 900์ด ๋ฏธ๋ง์ ํ๋ ์ด์์ ๋ฐ์ดํฐ๊ฐ ๋ง์ด ํ๋ ๊ฒ์ ๋ณผ ์ ์์๋๋ฐ์. LOL ๊ฒ์ ๋ฃฐ์ ๋ฐ๋ฅด๋ฉด 15๋ถ(900์ด..

๐ INDEX 01. ์ฌ์ฉํ ๋ฐ์ดํฐ ํ์ธ 02. ํ์ํ ์ปฌ๋ผ ์์ฑ 03. ๋ด๋น ๋ถ์ ์ฃผ์ ์ ์ ๋ฐ 1์ฐจ EDA- ์ค๋ธ์ ํธ์ ์นํจ์ ์๊ด๊ด๊ณ ๋ถ์- ํฌ, ๋ฐ์ค์ ์นํจ์ ๊ด๊ณ ๋ถ์ ๐ ํ๋ก์ ํธ ๊ฐ์ 01. ์ฌ์ฉํ ๋ฐ์ดํฐ ํ์ธ info(), describe() ๋ฅผ ํ์ฉํด ๋ฐ์ดํฐ๋ฅผ ๋น ๋ฅด๊ฒ ํ์ธ.์ด 180928๊ฐ์ ๋ฐ์ดํฐ๋ก 49๊ฐ ์ปฌ๋ผ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์. ๊ฒฐ์ธก์น๋ ์์์ผ๋, 900์ด ์ด์ ์ ๊ฒ์์ด ๋๋ ๊ฒฝ๊ธฐ๋ค์ด ์กด์ฌ(9496๊ฑด)๊ฒ์ ๊ท์น์ 15๋ถ(900์ด) ์ด์ ์ ๊ธฐ๊ถ์ ์งํํ ์ ์๊ธฐ ๋๋ฌธ์, ํน์ด ํ๋ ์ด๋ก ๊ฐ์ฃผ์ถํ ๊ฒ์ ํ๋ ์ด ์๊ฐ๋ณ๋ก ์ง๋จ์ ๋๋์ด ํ์ธํ๋ ๊ฒ์ผ๋ก ๋ ผ์. ๊ฐ ํ๋ ์ด์ด์ ํฌ ์, ๋ฐ์ค ์, ๋ฐ๋ฏธ์ง ํผํด๋, ๊ณจ๋ ์ด๋, ์์ผ ์ ์, ๊ตฐ์ค ์ ์ด ์๊ฐ(์ด)์ ์ ์ ์์์ผ๋, ์ฑํผ์ธ์..

๐ INDEX01. ๊ณ ๊ฐ ๊ตฌ์ฑ์ ๋ฐ๋ฅธ total_socre์ adr์ ๊ด๊ณ 02. ๊ตญ์ ์ ๋ฐ๋ฅธ total_socre์ adr์ ๊ด๊ณ 03. ๋ง์ผ ์ธ๊ทธ๋จผํธ์ ๋ฐ๋ฅธ total_score์ adr์ ๊ด๊ณ *ํธํ ์๋น์ค ์ด์ฉ ์ ์๋ total_socre, ํ๊ท ์ผ์ผ ์๊ธ์ adr ์นผ๋ผ์ ๋๋ค. *๋ง์ผ ์ธ๊ทธ๋จผํธ(market_segment)๋ ๊ณ ๊ฐ์ ์์ฝ ์ฑ๋์ ์๋ฏธํฉ๋๋ค. 01. ๊ณ ๊ฐ ๊ตฌ์ฑ์ ๋ฐ๋ฅธ total_score์ adr์ ๊ด๊ณ ์ ๋ SQL์ ํ์ฉํด์ ๋ฐ์ดํฐ๋ฅผ 1์ฐจ ์ง๊ณํ๊ณ , ํด๋น ๊ฒฐ๊ณผ๋ฅผ ํ์ด์ฌ์ ๊ฐ์ ธ์์ ์๊ฐํํ์ด์. ์ถํ์ SQL์์ ์ฟผ๋ฆฌ๋ฅผ CSV ํ์ผ๋ก ์ถ์ถํ๋ ๋ฐฉ๋ฒ์ ๋์ค์ ํ๋ฒ ์ ๋ฆฌํด์ ์ฌ๋ ค๋ณด๊ฒ ์ต๋๋ค! ๊ณ ๊ฐ ๊ตฌ์ฑ์ ๋ฐ๋ฅธ ํธํ ์๋น์ค ์ฌ์ฉ ์ ์๋ฅผ ์ง๊ณํ๊ธฐ ์ํด์ ์๋ธ ์ฟผ๋ฆฌ๋ฅผ ๋ ๋ฒ ์ฌ์ฉํ๋..

๐ Hotel Booking ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ด์ฉ 1. ๊ฒฐ์ธก์น ์ฒ๋ฆฌ : SQL์์ ์ฌ์ฉํ๊ธฐ ์ํด Na → Null ๊ฐ์ผ๋ก ๋ณ๊ฒฝํ์ด์. 2. ์ด์์น ์ฒ๋ฆฌ : adr(ํ๊ท ์ผ์ผ ์๊ธ) ์์ ์์ ๊ฐ์ ์ ๊ฑฐํ์ต๋๋ค. ์์ ๋ฐ์ดํฐ๊ฐ 1๊ฑด์ด๋ผ, ํ๊ท ์ผ๋ก ๋์ฒดํ๊ธฐ ๋ณด๋ค ์ ์ธํ๋ ๊ฒ์ ํํ์ด์. ์ด ์ธ์ ๋ค๋ฅธ ์ด์์น๋ ๋ฐ๊ฒฌํ์ง ๋ชป ํ๊ณ , NULL ๊ฐ์ 'ํด๋น ์์'์ด๋ผ๋ ์๋ฏธ๋ฅผ ๊ฐ๊ณ ์์ด์ ๊ทธ๋๋ก ํ์ฉํ์ต๋๋ค. 3. ๊ณ ๊ฐ ์ธ๊ทธ๋ฉํ ์ด์ : ๊ณ ๊ฐ ๊ตฌ์ฑ๋ณ, ๊ตญ์ ๋ณ, ์์ฝ ์ฑ๋๋ณ(market segmentation)๋ก ๊ตฐ์ง์ ๋๋์์ด์. Hotel Booking ๋ฐ์ดํฐ์๋ ๊ณ ๊ฐ์ ์ฑ๋ณ์ด๋ ์ฐ๋ น๋ ๋ฑ์ ์ ์ ์๋ ๋ฐ์ดํฐ๊ฐ ์์์ด์. ๊ทธ๋์ ์ฒซ๋ฒ์งธ๋ก ์ธ์ ๋ฐ ์์ด ๋๋ฐ ์ฌ๋ถ์ ๋ฐ๋ผ์ ๊ณ ๊ฐ ๊ตฌ์ฑ์ ๋๋์๊ณ , ๋ ๋ฒ์งธ๋ก ํธํ ..

๐ฅ ๋๋์ด ๋ฐ์ดํฐ๋ถ์ ๋ถํธ์บ ํ ์ฒซ ๋ฒ์งธ ํ ํ๋ก์ ํธ๋ฅผ ์์ํ์ต๋๋ค๐ฅ์ฒซ ํ๋ก์ ํธ ์ฃผ์ ๋ ๋ก ์ ์ ํ์ต๋๋ค. ๋ฐ์ดํฐ ๋ถ์์ด ๋ง์ด ํ์ฉ๋๋ ์๋น์ค ๊ธฐํ ํน์ ๋ง์ผํ ๋ถ์ผ ํ๋ก์ ํธ ์งํํ๊ณ ์ถ์๊ฑฐ๋ ์! ์บ๊ธ์ Hotel booking demand ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๊ธฐ๋ก ๊ฒฐ์ ํ๋๋ฐ์. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ฅผ ์ํด DBeaver ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ก ๋ถ๋ฌ์ค๋ ๊ณผ์ ์์ ์ค๋ฅ๋ฅผ ๋ง์ฃผํ๊ฒ ๋์ด ์ด๋ป๊ฒ ์ด๋ฅผ ํด๊ฒฐํ๊ณ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์๋์ง ์๊ฐํด๋๋ฆฌ๋ ค๊ณ ํฉ๋๋ค :) โ ๏ธ ์ค๋ ๋ง์ฃผํ ์๋ฌ ๋ฉ์์ง โ ๏ธ Error occurred during batch insert (you can disable batch insert in order to skip particular rows). ์ด์ : Can't parse numeric value [NA]..