๐พ ๋ฐ์ดํฐ๋ฒ ์ด์ค & ๋น ๋ฐ์ดํฐ ์ ๊ธฐ์ | ๐์ ์ฒ๊ธฐ ์ค๊ธฐ ๋๋น
์์ฝ
์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์ค๊ธฐ ์ํ ๋๋น, ๋น ๋ฐ์ดํฐ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ํต์ฌ ์ ๊ธฐ์ (Hadoop, HDFS, ๋ฐ์ดํฐ ๋ง์ด๋, ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค, ๋ฉํ๋ฐ์ดํฐ, ๋ง์ด๋ฐ์ดํฐ ๋ฑ)์ ๊ทผ๋ณธ ์๋ฆฌ๋ถํฐ ์๋ฒฝ ์ ๋ฆฌํฉ๋๋ค.
๐ก ์ ๊ธฐ์ ํํธ ์ค ๋ฐ์ดํฐ ๊ด๋ จ ๊ธฐ์ ์ ์ ์ฒ๊ธฐ ์ค๊ธฐ์์ ๊ทธ๊ฐ ๋ค๋ค์ง์ง ์์ ๋ถ๋ถ์ ๋๋ค. ๋์จ๋ค๋ฉด ๊ฐ์ฅ ๊ทผ๋ณธ์ ์ผ๋ก ์ฃผ์ํ ๊ธฐ์ ์ฉ์ด๊ฐ ์ถ์ ๋ ๊ฒ์ผ๋ก ์์ํฉ๋๋ค.
๐๏ธ ์ฃผ์ ๋ฐ์ดํฐ ์ ๊ธฐ์ ์์ฝํ
๋ถ๋ฅ | ๊ธฐ์ | ํต์ฌ ํค์๋ |
---|---|---|
๋น ๋ฐ์ดํฐ ๊ธฐ๋ฐ | โญ๏ธHadoop | ๋ถ์ฐ ์ฒ๋ฆฌ ํ๋ ์์ํฌ, HDFS + MapReduce, ์์ฝ์์คํ |
HDFS | ๋ถ์ฐ ํ์ผ ์์คํ , ๋ด๊ณ ์ฅ์ฑ, Write-Once-Read-Many | |
๋ฐ์ดํฐ ์์ง/์ ์ก | Chukwa | ๋๊ท๋ชจ ๋ก๊ทธ ์์ง, ์์ด์ ํธ-์ปฌ๋ ํฐ, HDFS ๊ธฐ๋ฐ |
Sqoop | RDBMS์ Hadoop ๊ฐ ๋ฐ์ดํฐ ์ ์ก, Import/Export | |
์คํฌ๋ํผ(Scrapy) | ์น ํฌ๋กค๋ง ํ๋ ์์ํฌ, ํ์ด์ฌ, ์๋ํ๋ ๋ฐ์ดํฐ ์์ง | |
๋ฐ์ดํฐ ๋ถ์/ํ์ฉ | โญ๏ธ๋ฐ์ดํฐ ๋ง์ด๋ | ํจํด/๊ท์น ๋ฐ๊ฒฌ, ๋ถ๋ฅ, ๊ตฐ์ง, ์ฐ๊ด ๋ถ์, ์ง์ ์ถ์ถ |
โญ๏ธ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค | ์์ฌ๊ฒฐ์ ์ง์, ์ฃผ์ ์ค์ฌ, ํตํฉ, ์๊ณ์ด, ๋นํ๋ฐ์ฑ | |
๋ฐ์ดํฐ ๋งํธ | ์จ์ดํ์ฐ์ค์ ์ถ์ํ, ํน์ ๋ถ์/์ฃผ์ , ์ ์ํ ๊ตฌ์ถ | |
๋ฐ์ดํฐ ๊ด๋ฆฌ | ๋ฉํ๋ฐ์ดํฐ | ๋ฐ์ดํฐ์ ๋ํ ๋ฐ์ดํฐ, ๋ฐ์ดํฐ ๊ด๋ฆฌ์ ํต์ฌ, ๋ฐ์ดํฐ ์นดํ๋ก๊ทธ |
๋์งํธ ์์นด์ด๋น | ์ฅ๊ธฐ ๋ณด์กด, ์ง๋ณธ์ฑ/๋ฌด๊ฒฐ์ฑ, ๋ฒ์ /์ญ์ฌ์ ๊ฐ์น | |
๋ง์ด๋ฐ์ดํฐ | ์ ๋ณด ์ฃผ๊ถ, ๋ฐ์ดํฐ ์ด๋๊ถ, ๊ฐ์ธ ๋ง์ถคํ ์๋น์ค |
๐ก ๋ฐ์ดํฐ ๊ธฐ์ ์ ๊ดํตํ๋ ๊ธฐ์
โญ๏ธ : ํ๊ธฐ ์ถ์ ๋์๋ ๊ฐ๋
๊ธฐ์ | ํต์ฌ ์๋ฆฌ | ์ด ๊ธฐ์ ์ด ๊ธฐ๋ฐ์ด ๋๋ ๊ฒ๋ค |
---|---|---|
โญ๏ธHadoop & ๋ถ์ฐ ๊ธฐ์ | ๋ถ์ฐ: ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๊ณณ์ ๋๋ ์ ์ฅํ๊ณ ์ฒ๋ฆฌ | ๊ฑฐ์ ๋ชจ๋ ๋น ๋ฐ์ดํฐ ๊ธฐ์ , ํด๋ผ์ฐ๋ ์คํ ๋ฆฌ์ง, ๋๊ท๋ชจ AI ๋ชจ๋ธ ํ์ต |
โญ๏ธ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค & ๋ง์ด๋ | ํตํฉ๊ณผ ์ถ์ถ: ๋ฐ์ดํฐ๋ฅผ ๋ชจ์ผ๊ณ ์ ์ ํ์ฌ ์ง์์ ๋ฐ๊ฒฌ | ๋น์ฆ๋์ค ์ธํ ๋ฆฌ์ ์ค(BI), ๊ณ ๊ฐ ๊ด๊ณ ๊ด๋ฆฌ(CRM), ์ถ์ฒ ์์คํ |
1. โญ๏ธHadoop๊ณผ ๋ถ์ฐ ๊ธฐ์ (๋ถ์ฐ)
'๋ถ์ฐ'์ ํตํด ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํฉ๋๋ค.
- ๊ฐ๋ : ํ๋์ ๊ณ ์ฑ๋ฅ ์ปดํจํฐ๊ฐ ์๋, ์ฌ๋ฌ ๋์ ์ผ๋ฐ ์ปดํจํฐ๋ฅผ ๋ฌถ์ด ๋ง์น ํ๋์ ๊ฑฐ๋ํ ์ปดํจํฐ์ฒ๋ผ ๋์ํ๊ฒ ๋ง๋๋ ์๋ฆฌ์ ๋๋ค. ๋ฐ์ดํฐ๋ ์ฌ๋ฌ ์กฐ๊ฐ์ผ๋ก ๋๋์ด ๊ฐ ์ปดํจํฐ์ ์ ์ฅ(HDFS)๋๊ณ , ๊ณ์ฐ ์์ ๋ํ ๊ฐ ์ปดํจํฐ๊ฐ ๋๋ ์ ๋์์ ์ฒ๋ฆฌ(MapReduce)ํฉ๋๋ค.
- ์ ๊ทผ๋ณธ์ ์ธ๊ฐ?: ์ด '๋ถ์ฐ' ํจ๋ฌ๋ค์์ด ์์๋ค๋ฉด ์ค๋๋ ์ ๋น ๋ฐ์ดํฐ, AI, ํด๋ผ์ฐ๋ ๊ธฐ์ ์ ์กด์ฌํ ์ ์์์ต๋๋ค. ํํ๋ฐ์ดํธ๊ธ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ณ ์์ฒ์ต ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง AI ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ชจ๋ ์์ ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
2. โญ๏ธ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค์ โญ๏ธ๋ฐ์ดํฐ ๋ง์ด๋ (ํตํฉ๊ณผ ์ถ์ถ)
'ํตํฉ'๊ณผ '์ถ์ถ'์ ํตํด ๋ฐ์ดํฐ์์ ์จ๊ฒจ์ง ๊ฐ์น๋ฅผ ์ฐพ์๋ ๋๋ค.
- ๊ฐ๋
:
- ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค: ์ฌ๋ฌ ๊ณณ์ ํฉ์ด์ ธ ์๋ ๋ฐ์ดํฐ(ERP, CRM, ๋ก๊ทธ ๋ฑ)๋ฅผ ํ ๊ณณ์ผ๋ก ๋ชจ์ 'ํตํฉ' ํ๊ณ , ๋ถ์ํ๊ธฐ ์ข์ ํํ๋ก '์ ์ ' ํ๋ ์ ์ฅ์์ ๋๋ค.
- ๋ฐ์ดํฐ ๋ง์ด๋: ์ด๋ ๊ฒ ์ ์ ์ ๋ ๋ฐ์ดํฐ ์์์ ์๋ฏธ ์๋ ํจํด๊ณผ ๊ท์น, ์ฆ '์ง์' ์ '์ถ์ถ' ํ๋ ๊ธฐ์ ์ ๋๋ค.
- ์ ๊ทผ๋ณธ์ ์ธ๊ฐ?: ๋จ์ํ ๋ฐ์ดํฐ๋ฅผ ์์๋๋ ๊ฒ์ ๋์ด, ๊ธฐ์ ์ด ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ์์ฌ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์๊ฒ ํ๋ ํต์ฌ ํ๋ก์ธ์ค์ ๋๋ค. ๋ชจ๋ BI(Business Intelligence), CRM, ์ถ์ฒ ์์คํ ์ ๊ทผ๊ฐ์ ์ด๋ฃน๋๋ค.
๐พ ๊ธฐ์ ๋ณ ์์ธ ์ค๋ช
๋น ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ธฐ์
โญ๏ธHadoop (ํ๋ก)
๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐ ์ฒ๋ฆฌํ๊ธฐ ์ํ ์คํ ์์ค ํ๋ ์์ํฌ์ด์ ๋น ๋ฐ์ดํฐ ์ํ๊ณ์ ์์์ ์ ๋๋ค.
- ํต์ฌ ๊ตฌ์ฑ:
- HDFS (Hadoop Distributed File System): ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ์๋ฒ์ ๋ถ์ฐํ์ฌ ์ ์ฅํ๋ ํ์ผ ์์คํ .
- MapReduce: ๋ถ์ฐ๋ ๋ฐ์ดํฐ๋ฅผ ๋ณ๋ ฌ๋ก ์ฒ๋ฆฌํ๋ ํ๋ก๊ทธ๋๋ฐ ๋ชจ๋ธ.
- ํน์ง: ์ ๋ ดํ ๋ฒ์ฉ ํ๋์จ์ด๋ฅผ ๋ฌถ์ด ๋๊ท๋ชจ ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ฑํ ์ ์์ด ๋น์ฉ ํจ์จ์ ์ ๋๋ค. ๋ด๊ณ ์ฅ์ฑ(Fault Tolerance)์ด ๋ฐ์ด๋ ์ผ๋ถ ์๋ฒ์ ์ฅ์ ๊ฐ ๋ฐ์ํด๋ ๋ฐ์ดํฐ ์ ์ค ์์ด ์์ ์ ์ผ๋ก ๋์ํฉ๋๋ค.
HDFS (Hadoop Distributed File System)
ํ๋ก์ ์ํด ์ค๊ณ๋ ๋์ฉ๋ ํ์ผ์ ๋ถ์ฐ ์ ์ฅ์ ์ํ ํ์ผ ์์คํ ์ ๋๋ค.
- ํน์ง: 'Write-Once-Read-Many' ๋ชจ๋ธ์ ์ต์ ํ๋์ด ์์ด, ํ ๋ฒ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ ์์ ํ๊ธฐ๋ณด๋ค ์ฃผ๋ก ์ฝ๋ ์ฉ๋๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๋ธ๋ก์ผ๋ก ๋๋๊ณ , ๊ฐ ๋ธ๋ก์ ๋ณต์ ํ์ฌ ์ฌ๋ฌ ์๋ฒ์ ์ ์ฅํจ์ผ๋ก์จ ๋ฐ์ดํฐ์ ์์ ์ฑ๊ณผ ๊ฐ์ฉ์ฑ์ ๋์ ๋๋ค.
๋ฐ์ดํฐ ์์ง ๋ฐ ์ ์ก ๊ธฐ์
Chukwa (์ฒ์)
๋๊ท๋ชจ ๋ถ์ฐ ์์คํ ์์ ๋ฐ์ํ๋ ๋ก๊ทธ ๋ฐ์ดํฐ๋ฅผ ์์ ์ ์ผ๋ก ์์งํ๊ธฐ ์ํ ์ํ์น ํ๋ก์ ํธ์ ๋๋ค.
- ๊ตฌ์กฐ: ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ ์์ด์ ํธ(Agent), ์์ง๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ ์ ์ฅ์๋ก ์ ๋ฌํ๋ ์ปฌ๋ ํฐ(Collector) ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ํน์ง: HDFS์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ ๊ฒ์ ๊ธฐ๋ณธ์ผ๋ก ํ๋ฉฐ, ์ค์๊ฐ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ๋ชจ๋ํฐ๋ง ์์คํ ๊ตฌ์ถ์ ์ฌ์ฉ๋ฉ๋๋ค.
Sqoop (์ค์ฟฑ)
๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค(RDBMS)์ ํ๋ก(HDFS, Hive ๋ฑ) ๊ฐ์ ๋๋์ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ ์กํ๋ ๋๊ตฌ์ ๋๋ค.
- ์ฃผ์ ๊ธฐ๋ฅ:
- Import: RDBMS์์ ํ๋ก์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ต๋๋ค.
- Export: ํ๋ก์์ RDBMS๋ก ๋ฐ์ดํฐ๋ฅผ ๋ด๋ณด๋ ๋๋ค.
- ํน์ง: MapReduce ์์ ์ ์์ฑํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ณ๋ ฌ๋ก ์ฒ๋ฆฌํ๋ฏ๋ก ๋น ๋ฅด๊ณ ์์ ์ ์ธ ๋ฐ์ดํฐ ์ ์ก์ด ๊ฐ๋ฅํฉ๋๋ค.
์คํฌ๋ํผ (Scrapy)
์น ์ฌ์ดํธ์์ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฅผ ์ถ์ถ(ํฌ๋กค๋ง)ํ๊ธฐ ์ํ ํ์ด์ฌ ๊ธฐ๋ฐ์ ์คํ ์์ค ํ๋ ์์ํฌ์ ๋๋ค.
- ํน์ง: ๋น๋๊ธฐ ์ฒ๋ฆฌ ๋ฐฉ์์ ์ฌ์ฉํ์ฌ ๋งค์ฐ ๋น ๋ฅธ ์๋๋ก ์น ํ์ด์ง๋ฅผ ์์งํ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ถ์ถ ๊ท์น(Spider)์ ์ ์ํ์ฌ ์ํ๋ ์ ๋ณด๋ง ์ ํํ๊ฒ ๊ฐ์ ธ์ฌ ์ ์์ผ๋ฉฐ, ์์งํ ๋ฐ์ดํฐ๋ JSON, CSV ๋ฑ ๋ค์ํ ํ์์ผ๋ก ์ ์ฅ์ด ๊ฐ๋ฅํฉ๋๋ค.
๋ฐ์ดํฐ ๋ถ์ ๋ฐ ํ์ฉ ๊ธฐ์
โญ๏ธ๋ฐ์ดํฐ ๋ง์ด๋ (Data Mining)
๋๊ท๋ชจ ๋ฐ์ดํฐ ์์์ ์๋ฏธ ์๋ ํจํด, ๊ท์น, ๊ด๊ณ๋ฅผ ์ฐพ์๋ด์ด ๊ฐ์น ์๋ ์ ๋ณด๋ก ๋ง๋๋ ๊ณผ์ ์ ๋๋ค.
- ์ฃผ์ ๊ธฐ๋ฒ:
- ๋ถ๋ฅ(Classification): ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ ์ ์๋ ๊ทธ๋ฃน์ผ๋ก ๋๋๋๋ค. (์: ์คํธ ๋ฉ์ผ ๋ถ๋ฅ)
- ๊ตฐ์งํ(Clustering): ์ ๏ฟฝ๏ฟฝํ ํน์ฑ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ผ๋ฆฌ ๊ทธ๋ฃน์ ๋ง๋ญ๋๋ค. (์: ๊ณ ๊ฐ ์ธ๋ถํ)
- ์ฐ๊ด ๋ถ์(Association): ๋ฐ์ดํฐ ํญ๋ชฉ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ฐพ์ต๋๋ค. (์: '๊ธฐ์ ๊ท'์ '๋งฅ์ฃผ'์ ์ฐ๊ด์ฑ)
โญ๏ธ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค (Data Warehouse)
๊ธฐ์ ์ ์์ฌ๊ฒฐ์ ์ ์ง์ํ๊ธฐ ์ํด, ์ฌ๋ฌ ์์คํ ์ ๋ฐ์ดํฐ๋ฅผ ์ฃผ์ ์ค์ฌ์ผ๋ก ํตํฉํ์ฌ ์ ์ฅํ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋๋ค.
- 4๋ ํน์ง:
- ์ฃผ์ ์ค์ฌ(Subject-Oriented): ๊ณ ๊ฐ, ์ ํ ๋ฑ ๋ถ์ ์ฃผ์ ๋ณ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ฑํฉ๋๋ค.
- ํตํฉ(Integrated): ๋ฐ์ดํฐ ํ์์ ์ผ๊ด๋๊ฒ ๋ณํํ์ฌ ์ ์ฅํฉ๋๋ค.
- ์๊ณ์ด(Time-Variant): ์๊ฐ์ ํ๋ฆ์ ๋ฐ๋ฅธ ๋ณํ๋ฅผ ๋ถ์ํ ์ ์๋๋ก ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํฉ๋๋ค.
- ๋นํ๋ฐ์ฑ(Non-Volatile): ๋ฐ์ดํฐ๊ฐ ํ ๋ฒ ์ ์ฅ๋๋ฉด ์ญ์ ํ๊ฑฐ๋ ์์ ํ์ง ์์ต๋๋ค.
๋ฐ์ดํฐ ๋งํธ (Data Mart)
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค์ ์ถ์ ๋ฒ์ ์ผ๋ก, ํน์ ๋ถ์๋ ์ฌ์ฉ์ ๊ทธ๋ฃน์ ์๊ตฌ์ ๋ง์ถฐ์ง ์๊ท๋ชจ ๋ฐ์ดํฐ ์ ์ฅ์์ ๋๋ค.
- ํน์ง: ํน์ ์ฃผ์ ์ ์ง์คํ๋ฏ๋ก ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋ณด๋ค ๋น ๋ฅด๊ณ ์ ๋ ดํ๊ฒ ๊ตฌ์ถํ ์ ์์ต๋๋ค. ์ ์ฌ์ ์ธ ๋ถ์๋ณด๋ค๋ ํน์ ํ์ ๋ถ์์ ๋ถ์ ์๊ตฌ๋ฅผ ์ถฉ์กฑ์ํค๋ ๋ฐ ๋ชฉ์ ์ด ์์ต๋๋ค.
๋ฐ์ดํฐ ๊ด๋ฆฌ ๊ธฐ์
๋ฉํ๋ฐ์ดํฐ (Metadata)
'๋ฐ์ดํฐ์ ๋ํ ๋ฐ์ดํฐ'๋ก, ๋ฐ์ดํฐ์ ๊ตฌ์กฐ, ์์ฑ, ์ด๋ ฅ, ๊ด๊ณ ๋ฑ ๋ชจ๋ ์ ๋ณด๋ฅผ ์ค๋ช ํฉ๋๋ค.
- ์ค์์ฑ: ๋ฐ์ดํฐ์ ์ถ์ฒ, ์๋ฏธ, ํ์์ ๋ช ํํ ํ์ฌ ๋ฐ์ดํฐ์ ๊ฐ์น๋ฅผ ๋์ด๊ณ , ์ฌ์ฉ์๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ฒ ์ฐพ๊ณ ์ดํดํ๋ฉฐ ํ์ฉํ ์ ์๋๋ก ๋์ต๋๋ค. ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค์ ๋ฐ์ดํฐ ํ์ง ๊ด๋ฆฌ์ ํต์ฌ ์์์ ๋๋ค.
๋์งํธ ์์นด์ด๋น (Digital Archiving)
์ฅ๊ธฐ ๋ณด์กด ๊ฐ์น๊ฐ ์๋ ๋์งํธ ์ ๋ณด๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์์ง, ๊ด๋ฆฌ, ๋ณด์กดํ์ฌ ๋ฏธ๋์ ํ์ฉํ ์ ์๋๋ก ํ๋ ํ๋์ ๋๋ค.
- ํน์ง: ์ ๋ณด์ ์ง๋ณธ์ฑ, ๋ฌด๊ฒฐ์ฑ, ์ ๋ขฐ์ฑ์ ๋ณด์ฅํ๋ ๊ฒ์ด ํต์ฌ์ ๋๋ค. ๋ฒ์ ์ฆ๊ฑฐ, ์ญ์ฌ์ ๊ธฐ๋ก, ์ฐ๊ตฌ ๋ฐ์ดํฐ ๋ฑ์ ์์ ํ๊ฒ ๋ณด์กดํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค.
๋ง์ด๋ฐ์ดํฐ (MyData)
์ ๋ณด ์ฃผ์ฒด์ธ ๊ฐ์ธ์ด ์์ ์ ๋ฐ์ดํฐ์ ๋ํ ํต์ ๊ถ์ ๊ฐ์ง๊ณ ์ง์ ๊ด๋ฆฌํ๊ณ ํ์ฉํ๋ ๋ฐ์ดํฐ ํจ๋ฌ๋ค์์ ๋๋ค.
- ํต์ฌ ๊ถ๋ฆฌ: ๊ฐ์ธ์ ์ฉ์ ๋ณด ์ด๋๊ถ์ ํตํด ๊ฐ์ธ์ด ๊ธ์ต๊ธฐ๊ด ๋ฑ์ ํฉ์ด์ ธ ์๋ ์์ ์ ์ ๋ณด๋ฅผ ํ ๊ณณ์ ๋ชจ์ ๊ด๋ฆฌํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง์ถคํ ์์ฐ๊ด๋ฆฌ, ์ ์ฉ๊ด๋ฆฌ ๋ฑ์ ์๋น์ค๋ฅผ ๋ฐ์ ์ ์์ต๋๋ค.
๐ ์ ์ฒ๊ธฐ ์ค๊ธฐ ๋๋น ๋ฌธ์
๋ฌธ์ | ์ฌ๋ฌ ์ปดํจํฐ๋ฅผ ์ฐ๊ฒฐํ์ฌ ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐ ์ ์ฅํ๊ณ ๋ณ๋ ฌ ์ฒ๋ฆฌํ๋ ์คํ ์์ค ํ๋ ์์ํฌ๋ก, HDFS์ MapReduce๋ฅผ ํต์ฌ ๊ตฌ์ฑ ์์๋ก ํ๋ ๊ธฐ์ ์ ๋ฌด์์ธ๊ฐ? |
๋ต๋ณ | |
์ ๋ต | ์ ๋ต ๋ณด๊ธฐ |
๋ฌธ์ | ๊ธฐ์ ์ ์์ฌ๊ฒฐ์ ์ง์์ ์ํด, ์ฌ๋ฌ ์์ค์ ๋ฐ์ดํฐ๋ฅผ ์ฃผ์ ์ค์ฌ์ผ๋ก ํตํฉํ๊ณ ์๊ณ์ด์ ์ผ๋ก ์ ์ฅํ๋ ๋นํ๋ฐ์ฑ ๋ฐ์ดํฐ ์ ์ฅ์๋ ๋ฌด์์ธ๊ฐ? |
๋ต๋ณ | |
์ ๋ต | ์ ๋ต ๋ณด๊ธฐ |
๋ฌธ์ | ๋๊ท๋ชจ ๋ฐ์ดํฐ ์งํฉ์์ ์ ์ฉํ ํจํด๊ณผ ๊ท์น์ ๋ฐ๊ฒฌํ์ฌ ์ง์์ ์ถ์ถํ๋ ๊ณผ์ ์ผ๋ก, ๋ถ๋ฅ, ๊ตฐ์ง, ์ฐ๊ด ๋ถ์ ๋ฑ์ ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ ๊ธฐ์ ์ ๋ฌด์์ธ๊ฐ? |
๋ต๋ณ | |
์ ๋ต | ์ ๋ต ๋ณด๊ธฐ |
๋ฌธ์ | '๋ฐ์ดํฐ์ ๋ํ ๋ฐ์ดํฐ'๋ฅผ ์๋ฏธํ๋ฉฐ, ๋ฐ์ดํฐ์ ์์น, ํ์, ์ด๋ ฅ, ์์ ์ ๋ฑ์ ์ ๋ณด๋ฅผ ํฌํจํ์ฌ ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ์ฉ์ดํ๊ฒ ํ๋ ๊ฒ์ ๋ฌด์์ธ๊ฐ? |
๋ต๋ณ | |
์ ๋ต | ์ ๋ต ๋ณด๊ธฐ |
๋ฌธ์ | ์ ๋ณด ์ฃผ์ฒด์ธ ๊ฐ์ธ์ด ์์ ์ ๋ฐ์ดํฐ์ ๋ํ ํต์ ๊ถ์ ๊ฐ์ง๊ณ , ๊ธ์ต, ์๋ฃ ๋ฑ ์ฌ๋ฌ ๊ธฐ๊ด์ ํฉ์ด์ง ๊ฐ์ธ ๋ฐ์ดํฐ๋ฅผ ์ง์ ๊ด๋ฆฌํ๊ณ ํ์ฉํ๋ ์ ๋๋ ๋ฌด์์ธ๊ฐ? |
๋ต๋ณ | |
์ ๋ต | ์ ๋ต ๋ณด๊ธฐ |