hdfsToS3

Definition

HDFS ํŒŒ์ผ/ํด๋”๋ฅผ S3์— ๋ณต์‚ฌ ํ•˜๋Š” ๋…ธ๋“œ์ด๋‹ค. ์ขŒ์ธก [Flow๊ตฌ์„ฑ]๋…ธ๋“œ ์ค‘ [hdfsToS3]๋…ธ๋“œ๋ฅผ drag & drop ํ•œ ํ›„ Property ํ•ญ๋ชฉ์„ ์ž…๋ ฅํ•œ๋‹ค. Property ํŒจ๋„์˜ [๋”๋ณด๊ธฐ+] ๋ฒ„ํŠผ์„ ๋ˆ„๋ฅด๋ฉด ์ž…๋ ฅ๊ฐ€๋Šฅํ•œ ์ „์ฒด Property ํ•ญ๋ชฉ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

Set

[setting], [scheduler], [parameter] ์„ค์ •์€ [์›Œํฌํ”Œ๋กœ์šฐ ์ƒ์„ฑ] > [์„ค์ •]์„ ์ฐธ๊ณ ํ•œ๋‹ค.

property

[Node Description] ์ž‘์„ฑ ์ค‘์ธ ๋…ธ๋“œ๋ช… ์ž…๋ ฅ

flow007

  1. hdfsํŒŒ์ผ๊ฒฝ๋กœ(๋ถˆ๋Ÿฌ์˜ค๊ธฐ) : ๋ณต์‚ฌํ•  ํŒŒ์ผ ๊ฒฝ๋กœ ์„ ํƒ
  2. S3 ํŒŒ์ผ๊ฒฝ๋กœ (์ €์žฅ๊ฒฝ๋กœ) : ์ €์žฅํ•  S3 ํŒŒ์ผ๊ฒฝ๋กœ ์„ ํƒ
  3. ETL ๊ฒฐ๊ณผํŒŒ์ผ ์—ฌ๋ถ€ : ETL ๊ฒฐ๊ณผํŒŒ์ผ์„ ๋กœ๋“œํ•˜๋ ค๋Š” ๊ฒฝ์šฐ์— True ์„ ํƒ
  4. Credential : S3 ์—‘์„ธ์Šค ์ •๋ณด ( S3 ํŒŒ์ผ๊ฒฝ๋กœ ์„ ํƒ์‹œ ์ž๋™์…‹ํŒ…๋จ )

Example

HDFS ํŒŒ์ผ์— ์ ์žฌ๋œ ๋ฐ์ดํ„ฐ๋ฅผ S3์— ๋ณต์‚ฌํ•œ๋‹ค.

  1. hdfsํŒŒ์ผ๊ฒฝ๋กœ(๋ถˆ๋Ÿฌ์˜ค๊ธฐ)์—์„œ [ํŒ์—…์—ด๊ธฐ] ๋ฒ„ํŠผ์„ ๋ˆŒ๋Ÿฌ ํด๋Ÿฌ์Šคํ„ฐ์™€ ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํƒํ•œ๋‹ค.

flow056

  1. S3 ํŒŒ์ผ๊ฒฝ๋กœ(์ €์žฅ๊ฒฝ๋กœ)์—์„œ [ํŒ์—…์—ด๊ธฐ] ๋ฒ„ํŠผ์„ ๋ˆŒ๋Ÿฌ Bucket ๋ฐ ์ €์žฅ๊ฒฝ๋กœ๋ฅผ ์„ ํƒํ•œ๋‹ค. ์šฐ์ธก [Bucket๊ด€๋ฆฌ] ๋ฒ„ํŠผ์„ ๋ˆŒ๋Ÿฌ ๋ฒ„ํ‚ท์„ ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ๋‹ค. S3 ํŒŒ์ผ๊ฒฝ๋กœ๋ฅผ ์„ ํƒํ•˜๋ฉด 4. Credential์€ ์ž๋™ ์…‹ํŒ…๋œ๋‹ค.

flow058

  • [Bucket๊ด€๋ฆฌ] ๋ฒ„ํŠผ์„ ๋ˆŒ๋Ÿฌ ์‹ ๊ทœ๋ฒ„ํ‚ท ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Œ

flow058

  1. ETL ๊ฒฐ๊ณผํŒŒ์ผ ์—ฌ๋ถ€๋Š” True๋ฅผ ์„ ํƒํ•œ๋‹ค.

flow059