hiveToHdfs
Definition
์๊ฒฉ์ ์๋ Hive ํ ์ด๋ธ ๋ฐ์ดํฐ๋ฅผ HDFS๋ก ๊ฐ์ ธ์ฌ ์ ์๋ค. ์ข์ธก [Flow๊ตฌ์ฑ]๋ ธ๋ ์ค [hiveToHdfs]๋ ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์ ๋ ฅํ๋ค. Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ ์์ฑ] > [์ค์ ]์ ์ฐธ๊ณ ํ๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- prepare : ๋
ธ๋ ์คํ ๊ฒฐ๊ณผ๋ฅผ HDFS์ ์ ์ฅํ๊ธฐ ์ํด ํ์ผ์ญ์ /ํด๋์์ฑ ์์
์ ์ํ(์ํฌํ๋ก์ฐ ๋ฐ๋ณต์คํ ์ ํ์ฉ๊ฐ๋ฅ)
- delete : ๋ ธ๋ ์คํ ์ ์ญ์ ํ ํด๋/ํ์ผ ๊ฒฝ๋ก
- mkdir : ๋ ธ๋ ์คํ ์ ์์ฑํ ํด๋ ๊ฒฝ๋ก
- cluster : Hive๋ฅผ ์ํํ ํด๋ฌ์คํฐ(์ง์ ์ ๋ ฅ ์ ํ์ 3,4,5 ์ ๋ณด ์ง์ ์ ๋ ฅ)
- url : HIVE ์ ์ ์ฃผ์(JDBC URL). jdbc:hive2://hdp-master01:10000
- user : Hive ์ฌ์ฉ์ ์ด๋ฆ
- password : Hive ์ฌ์ฉ์ ์ํธ
- path : ๊ฒฐ๊ณผ๋ฌผ์ ์ ์ฅํ HDFS ๊ฒฝ๋ก
- filename : ์ ์ฅํ ํ์ผ ์ด๋ฆ
- header : ์ปฌ๋ผ ๋ช
ํค๋ ํฌํจ ์ ๋ฌด
- ์ฒดํฌ๋ฐ์ค ์ ํ : ์ปฌ๋ผ์ ๋ณด ํฌํจ
- ์ฒดํฌ๋ฐ์ค ํด์ : ์ปฌ๋ผ์ ๋ณด ๋ฏธํฌํจ
- overwrite : HDFS์ ํด๋น ํ์ผ์ด ์กด์ฌํ ๊ฒฝ์ฐ overwrite/append ์ฌ๋ถ
- ์ฒดํฌ๋ฐ์ค ์ ํ : overwrite ์ํ(ํด๋น ํ์ผ ๋ฎ์ด์ฐ๊ธฐ)
- ์ฒดํฌ๋ฐ์ค ํด์ : append ์ํ(ํด๋น ํ์ผ์ ๋ด์ฉ append)
- delimiter : HDFS์ ์ ์ฅํ ๊ฒฐ๊ณผ๋ฌผ ํ์ผ์ ๊ตฌ๋ถ์
- sql : ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๊ธฐ ์ํ SQL ์ ๋ ฅ(SELECT ์ฟผ๋ฆฌ ์ฌ์ฉ)
- version : Hive ๋ฒ์ (1.2.1, 3.1.1 ์ค ํ1)
- retry
- max : ์คํ ์คํจ ์ ์ฌ์๋ ํ์
- period : ์ฌ์๋ ์ฃผ๊ธฐ(๋ถ ๋จ์)
- forceOK : ๋ฐ์ดํฐ ์ฒ๋ฆฌ๊ฐ ์คํจํด๋ ์ ์์ผ๋ก ํ์ํ๊ณ ์ข ๋ฃ
Example
kbtest ํด๋ฌ์คํฐ hive์ ์ ์ฅ๋ iris ํ ์ด๋ธ์ ์กฐํํ์ฌ test1234 ํด๋ฌ์คํฐ์ result.csv ํ์ผ๋ก ์ ์ฅํ๋ค.
- [๋ธ๋ผ์ฐ์ ] > [HIVE] ์์ kbtest ํด๋ฌ์คํฐ Hive ๊ณ์ ์ iris ํ ์ด๋ธ ๋ด์ญ์ ํ์ธํ๋ค.
setting, property ํจ๋์์ ์๋์ ๊ฐ์ด ์ ๋ ฅํ๋ค.
โ setting ํจ๋์์ [hiveToHdfs] ๋ ธ๋๋ฅผ ์คํํ ํด๋ฌ์คํฐ๋ฅผ ์ ํ
โก property ํจ๋์์ hive๊ฐ ์์นํ ํด๋ฌ์คํฐ๋ฅผ ์ ํ
โข path ์ ๋ ฅํญ๋ชฉ์ ํ์ผ ๋ธ๋ผ์ฐ์ ๋ฅผ ์ด์ด์ result.csvํ์ผ์ ์ ์ฅํ ๊ฒฝ๋ก ์ ํ
โฃ query ์ ๋ ฅ
- ์ํฌํ๋ก์ฐ ์คํ๊ฒฐ๊ณผ๋ ์๋์ ๊ฐ๋ค.