๐๋ฐ์ดํฐ ์ธํ๋ผ -1

๐ญํ๋ฆฐ๋ถ๋ถ์ ์ง์ ๋ถํ๋๋ ค์
- โถ๋ฐ์ดํฐ ์ธํ๋ผ (1/2) : ์ ์ฒด์ ์ธ ๋งฅ๋ฝ (OLAP์ OLTP, ๋ฐ์ดํฐ์จ์ดํ์ฐ์ค(DW),ETL,ODS ๋ฑ๋ฑ)
- ๋ฐ์ดํฐ ์ธํ๋ผ (2/2) : ์ฐ๋ฆฌํ์ฌ์ ๋ฐ์ดํฐ ์ธํ๋ผ (ํ์ฌ๊ด๋ จ๋ด์ฉ์ด๋ผ ํฌ์คํ
ํ์ง ์์ผ๋ ๋์ค์ ์ฐธ๊ณ ์ฉ์ผ๋ก ๋จ๊ฒจ๋ก๋๋ค)
ํฐ ์์คํ
์์ ๋ฐ์ดํฐ๊ฐ ํ๋ฅด๋ ์กฐ์ง์ด ๋๋ ค๋ฉด, ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ค๋ฉด ๋ฐ์ดํฐ ์ธํ๋ผ๊ฐ ์ ๊ตฌ์ถ๋์ด์์ด์ผํ๋ค.
๋ฐ์ดํฐ ์ธํ๋ผ๋ฅผ ๊ตฌ์ถํ๋ ค๋ฉด DB๋ง ์์ผ๋ฉด ๋๋๊ฒ ์๋๊ณ ๋ค์ํ ๊ธฐ์ ๊ณผ ์ฌ๋ฌ๊ฐ์ง ์๋ฃจ์
, ์คํ์์ค, saas๋ฑ์ด ์ฎ์ฌ์ ๊ตฌ์ถ๋๋๊ฑฐ๋ค.
์ ๋ง ๋ค์ํ๊ณ ๋ณต์กํ๋ฐ, ์๋ ๋ํ์ ๋ํด์ ์ดํดํ๋๊ฑฐ๋ฅผ ๋ชฉํ๋ก ๊ณต๋ถ ํ๋ค.

- ์๋ ๋ด์ฉ์ ์ดํดํจ์ ์์ด
์ ๋ํ(Unified Data Infrastructure (2.0)
๋ฅผ ๊ณ์ ์ฐธ๊ณ ํ๋ฉด์ ๋ณด๊ธธ ๋ฐ๋๋๋น. - ์๋๊ฑด 2020๋
๋๋ฒ์
- ๊ฐ๋จ์ค๋ช
: ์์ค์์ ๊ฐ์ ธ์จ ๋ฐ์ดํฐ๋ฅผ ๋ณํํ๊ณ ์ ์ฌ, ๋ถ์ํด์ ๋ณด์ฌ์ค๋ค๊ฐ ๋ฐ์ดํฐ ์ธํ๋ผ์์ ํ๋ ์ผ์.
1. source : ํ์ฌ ๋ด์ ๋ชจ๋ ๋ฐ์ดํฐ๊ฐ ๋ง๋ค์ด์ง๋๊ณณ
2. Ingestion and transformation : ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์์ ๋ณํํ๋๊ณณ
3. Stroage : ์คํ ๋ฆฌ์ง
4. Query and Proceesing : ๋ค์ด์จ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์์ธก (๋จธ์ ๋ฌ๋)
5. Analysis and Output : ๋ถ์๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ณณ
๐๋ฐ์ดํฐ ์ธํ๋ผ์ ๋ชฉ์
- (๋ถ์์์คํ ) ๋น์ฆ๋์ค ๋ฆฌ๋๋ค์ ์์ฌ๊ฒฐ์ ์ ๋์์ฃผ๊ธฐ
- (์ด์์์คํ ) ์๋น์ค / ์ ํ์ ๋ฐ์ดํฐ์ ๋์์ ๋ฐ์ ํฅ์์ํค๊ธฐ
๐Production System (Source
) VS DW(Stroage~query and processing
) VS DL(Stroage~query and processing
)

Production System
- ERP, CRM(ex salesforce), DB ๋ฑ๋ฑ ์์ฒ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ ์์คํ
์ผ๋ก ์์คํ
๋ง๋ค ๋ชจ๋ ์์คํ
์ ๋ง๊ฒ ์ ์๋ ๋ฐฉ์์ผ๋ก ์ ์ฅํ๊ณ ์์ด ๋ชจ๋ ๋ค ๋ค๋ฅธ ํํ์.
- ๋ฐ์ดํฐ๋ฅผ ์ ๊ทํํด์ ๊ฐ์ง๊ณ ์์ (๋ค์ํ ํ ์ด๋ธ์ด ์กด์ฌ)
Data Warehouse
- ํตํฉ๋ ๋ณด๊ณ ์ ์์ฑ์ ์ํด ๋ค์ํ ์์ค๋ก ๋ถํฐ
์ถ์ถ(E)
,๋ณํ(T)
๊ณผ์ ์ ๊ฑฐ์น ๋ฐ์ดํฐ๊ฐ ์๋๊ณณ- ๋ค์ฐจ์(Dimensional) ๋ฐ์ดํฐ ๋ชจ๋ธ์ ์ฌ์ฉํจ(์ฐ๋ฆฐ ์คํ์คํค๋ง ์ฌ์ฉ ์ค)
- ํต๊ณ์ฉ ๋ฐ์ดํฐ๊ฐ ํ์ํ๊ธฐ๋๋ฌธ์ ์ผ๋ฐ์ ์ธ DB ๋ฐ์ดํฐ์ ์ ์ฅ๋ฐฉ์์ด ๋ค๋ฆ(๋ง์ ๊ณ์ฐ์ ์๊ตฌํ๋ Join์ ํผํ๊ธฐ ์ํจ)
- facts(์ฌ์ค = ๊ฐ) / deimensions(์ฐจ์ = ์กฐํ์กฐ๊ฑด) / ์์ฑ(attribute) / ์์ฑ๊ณ์ธต(Hierarchies)๋ก ๊ตฌ์ฑ๋จ
- start scheme : ํ๋์ ์ฌ์ค ํ ์ด๋ธ, ๋ค์์ ์ฐจ์ ํ ์ด๋ธ / ๋ฐ์ดํฐ๋ฅผ ๋น์ ๊ทํํจ
- ๋ค์ฐจ์(Dimensional) ๋ฐ์ดํฐ ๋ชจ๋ธ์ ์ฌ์ฉํจ(์ฐ๋ฆฐ ์คํ์คํค๋ง ์ฌ์ฉ ์ค)

Data Lake
- AI,ML๋ฐ ๊ณ ๊ธ ๋ถ์์ ์ํด ์ ํ,๋น์ ํ์ ๋ค์ํ
์์ฒ๋ฐ์ดํฐ
๋ฅผ ๊ทธ๋๋ก ์์งํจ
๐OLTP(Source
) vs OLAP(Analysis and Output
)

- ๋ ๋ค ์จ๋ผ์ธ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ๋ก์ธ์ค์ด์ง๋ง ์ฐจ์ด๊ฐ ์๋ค.
OLTP (On-Line Transaction Processing)
- ๋์์ ๋ฐ์ํ๋ ๋ค์์ ํธ๋์ญ์ ์ ์คํํ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ๋ก์ธ์ค์ (์ผ๋ฐ์ ์ธ ๋ฐ์ดํฐ CRUD๊ฐ ํฌํจ๋จ)
OLAP (On-Line Analytical Processing )
- ํธ๋์ญ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ ๋ง์ ์ธ์ฌ์ดํธ๋ฅผ ์ถ์ถํ์ฌ ์์ง์ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์์ฌ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ๋ฐ ํ์ฉํ ์ ์๊ฒ ํด์ค

๐ETL (vs ELT) Ingestion and Transport

ETL
- ๋ฐ์ดํฐ ์ถ์ถ,๋ณํ,์ ์ฌ 3๋จ๊ณ์ ์ถ์ฝ์ด๋ก, ๋ค์ํ
sources
์์ ๋ค๋ฅธ ๋ชฉ์ ์ง๋ก ์ด๋์ํค๋ ๊ณผ์ ์ ๋งํจ (DB์์ DB๋ก, DB์์ DW๋ก, ํ์ผ์์ DB๋ก ๋ฑ๋ฑ ๋ชจ๋ ๊ฑธ ์๋ฏธํจ) - DB๋ฑ๋ฑ์
source
์์ DB,DW,DM ๋ฑ๋ฑ์ผ๋ก ์ด๋์ํด- ์ถ์ถ(
E
xtract) :์์ค
์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๋ ETL ํ๋ก์ธ์ค์ ์์ ๋จ๊ณ - ๋ณํ(
T
ransform) : ์ถ์ถํ ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ณตํด์ ๋ชฉ์ ์ง์ ๋ง๋ ๋ฐ์ดํฐ๋ก ๋ณํํ๋ ๋จ๊ณ - ์ ์ฌ(
L
oad) : ๋ณํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ชฉ์ ์ง๋ก ์ด๋ํ๊ณ ์ ์ฅํ๋ ๋จ๊ณ
- ์ถ์ถ(
ELT?
- ETL์ ํฐ ๋ฌธ์ ์ : ์ถ์ถ - ๋ณํ์ด ์๋ํ ๋ ์ ์๊ณ ๋ณํ์ด ํ์ฌ๋ง๋ค ์์คํ
๋ง๋ค ๋ค๋ฅธ ๋ฌธ์ ๊ฐ ์์. ๋ณํ ์ ์ค๋ฅ๋ ๋ง์.
- ELT๋ ์ฐ์ ์ถ์ถ - ์ ์ฌ๋ฅผ ํด์ ๋ค ๋ฃ๊ณ (์๋ํ ๊ฐ๋ฅ) ๋ณํ๋ง ๋ฐ๋กํ๋ ํ๋ก์ธ์ค
๐ODS(Operational Data Store) vs DW(Stroage~query and processing
)

- DW์ ์ค๊ฐ ์์ญ์ผ๋ก ์ฌ์ฉ๋๋ DB.
- ์ด์ ์์คํ ์ผ๋ก๋ถํฐ Raw ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ ์๋ณธ์ผ๋ก ์ ์ฅํจ
- ์ฐจ์ด์
- ์ฟผ๋ฆฌ ๋ณต์ก๋ : ODS๊ฐ ์๋์ ์ผ๋ก ๊ฐ๋จํ๊ณ ์ ์์์ ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ ์ ํ : DW๋ ๋น์ฆ๋์ค ์์ฌ๊ฒฐ์ ์ ์ฌ์ฉํ๊ธฐ ์ํ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ ODS๋ ํ์ฌ์ํ ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ ๋ฒ์๊ฐ ์ ํ๋จ
- ๋ถ์์ ์ฑ : ์์ ๊ฐ์ ์๊ธฐ๊ธดํ๋ฐ ODS๊ฐ ๋ ๋ณ๋์ฑ์ด ๋์
- ์คํค๋ง : DW๋ ๊ณ ์ ๋ ์คํค๋ง๋ฅผ ๊ฐ์ ธ์ ๊ทธ์ ๋ฐ๋ผ ETLํ๋ก์ธ์ค๊ฐ ํ์ํจ, ODS๋ ์คํค๋ง์ ๋ฐ๋ผ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ ํจ.
- ์ถ์ฒ
- https://www.youtube.com/watch?v=g_c742vW8dQ
- https://a16z.com/emerging-architectures-for-modern-data-infrastructure/
- https://www.databricks.com/kr/glossary/star-schema
- https://itwiki.kr/w/%EC%8A%A4%ED%83%80_%EC%8A%A4%ED%82%A4%EB%A7%88
- https://www.informatica.com/resources/articles/what-is-etl.html
- https://www.oracle.com/kr/database/what-is-oltp/
- https://narup.tistory.com/81
- https://www.techtarget.com/searchoracle/definition/operational-data-store
- https://blog.skby.net/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%9B%A8%EC%96%B4%ED%95%98%EC%9A%B0%EC%8A%A4dw%EC%99%80-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A0%88%EC%9D%B4%ED%81%ACdl/
๋ค๋ฅธ ์ฌ๋ฏธ์๋ ๊ธ๋ค๋ ํ๋ฒ ๋ณด๊ณ ๊ฐ์ธ์
์ค๋ผํด DBํ๋_์ํํธํ์ฑ,ํ๋ํ์ฑ
์์ ํ์ฌ์์ ์ด์์ค์ธ ์๋น์ค๊ฐ ์ด๋ฐ ์ ๋ฐ ๋ฌธ์ ๋ค๋ก ์กฐ์ฉํ ์ผ์ด ์๋๋ฐ, ํด๊ฐ๋ฅผ ๋ค๋ ์ค๊ณ ๋ณด๋ DB ์ฑ๋ฅ๋ฌธ์ ๋ก ์๋๋ฌ์ ๋ค. ํด๊ฒฐ์ ํ ๋ฏ ํด์ ํด๊ฒฐํ ๋ฐฉ๋ฒ์ค์ ํ๊ฐ์ง์ ๋ํด ์ ๋ฆฌํ๋ ค๊ณ ํ๋ค
janggiraffe.tistory.com
์ค๋ผํด DBํ๋_์ํํธํ์ฑ,ํ๋ํ์ฑ_2
์ค๋ผํด DBํ๋_์ํํธํ์ฑ,ํ๋ํ์ฑ ์์ ํ์ฌ์์ ์ด์์ค์ธ ์๋น์ค๊ฐ ์ด๋ฐ ์ ๋ฐ ๋ฌธ์ ๋ค๋ก ์กฐ์ฉํ ์ผ์ด ์๋๋ฐ, ํด๊ฐ๋ฅผ ๋ค๋ ์ค๊ณ ๋ณด๋ DB ์ฑ๋ฅ๋ฌธ์ ๋ก ์๋๋ฌ์ ๋ค. ํด๊ฒฐ์ ํ ๋ฏ ํด์ ํด๊ฒฐํ ๋ฐฉ๋ฒ
janggiraffe.tistory.com