distcp
Definition
HDFS์ ์ ์ฅ๋ ํ์ผ์ ๋ค๋ฅธ HDFS๋ก ๋ณต์ฌํ๋ ๋ ธ๋์ด๋ค. ์ข์ธก [Flow๊ตฌ์ฑ]๋ ธ๋ ์ค [distcp]๋ ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์ ๋ ฅํ๋ค. Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ ์์ฑ] > [์ค์ ]์ ์ฐธ๊ณ ํ๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- retry : max: ์ฌ์ํ ํ ์ : period: ์ฌ์ํ ๊ฐ๊ฒฉ
- argument : ์ฒซ๋ฒ์ฌ arg ๊ฒฝ๋ก๋ฅผ 2,3,4,โฆ,n ๊ฒฝ๋ก๋ก ๋ณต์ฌํ๋ค.
- forceOK : ์คํจ ์ ๊ฐ์ OK ์ฒ๋ฆฌ ์ฌ๋ถ
Example
kbtest ํด๋ฌ์คํฐ์ HR_Retention.csvํ์ผ์ test1234 ํด๋ฌ์คํฐ์ [distcp] ๋ ธ๋๋ฅผ ์ฌ์ฉํ์ฌ ๋ณต์ฌํ๋ค.
- ์ฒซ ๋ฒ์งธ arg์ HR_Retention.csvํ์ผ์ด ์ ์ฅ๋ path๋ฅผ, ๋ ๋ฒ์งธ arg์ target path๋ฅผ ์ ๋ ฅํ๋ค.
- source : hdfs://kbtest-accu-hdfs-nn.suka:9000/tmp/test
- target : hdfs://test1234-accu-hdfs-nn.suka:9000/tmp
- distcp ์ํฌํ๋ก์ฐ ์คํ ํ test1234 ํด๋ฌ์คํฐ์ ./test/HR_retention.csvํ์ผ์ด ์์ฑ๋์๋ค.