hive
Definition
hive ์ฟผ๋ฆฌ๋ฅผ ์ํํ๋ ๋ ธ๋๋ก, ์ง์ ์ ๋ ฅ ๋ฐฉ์๊ณผ ์คํฌ๋ฆฝํธ ํ์ผ ๋ถ๋ฌ์ค๊ธฐ ๋ฐฉ์์ ์ง์ํ๋ค. ์ข์ธก [Flow๊ตฌ์ฑ]๋ ธ๋ ์ค [hive]๋ ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์ ๋ ฅํ๋ค. Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ ์์ฑ] > [์ค์ ]์ ์ฐธ๊ณ ํ๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- prepare : ๋
ธ๋ ์คํ ๊ฒฐ๊ณผ๋ฅผ HDFS์ ์ ์ฅํ๊ธฐ ์ํด ํ์ผ์ญ์ /ํด๋์์ฑ ์์
์ ์ํ(์ํฌํ๋ก์ฐ ๋ฐ๋ณต์คํ ์ ํ์ฉ๊ฐ๋ฅ)
- delete : ๋ ธ๋ ์คํ ์ ์ญ์ ํ ํด๋/ํ์ผ ๊ฒฝ๋ก
- mkdir : ๋ ธ๋ ์คํ ์ ์์ฑํ ํด๋ ๊ฒฝ๋ก
- file : ๋ ธ๋์์ ์ฌ์ฉํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ฒฝ๋ก๋ฅผ ์ค์
- archivce : archive๊ฒฝ๋ก๋ฅผ ์ค์
- retry : ์ฌ์ํ ํ์ ๋ฐ ๊ฐ๊ฒฉ
- max : ์ฌ์ํ ํ ์
- period : ์ฌ์ํ ๊ฐ๊ฒฉ
- jobXml : jobxml์ ๋ ฅ
- configuration : ์คํ์ ์ฌ์ฉํ ์์ฑ (key, value) ์ ๋ ฅ
- hiveExecute (inputType : query, script ์ค ํ1)
- query: query ์ ๋ ฅ (query editor ์ฌ์ฉ๊ฐ๋ฅ)
- script: scriptFile ๊ฒฝ๋ก ์ ํ
- param : ํ๋ผ๋ฏธํฐ ์ค์
- argument : ์ธ์ ์ค์
- forceOK : ์คํจ ์ ๊ฐ์ OK ์ฒ๋ฆฌ ์ฌ๋ถ
Oozie์์ ์ ๊ณตํ๋ ๊ธฐ๋ฅ์ผ๋ก JDBC๋ฅผ ํ์ฉํ์ฌ ์๊ฒฉ์ ์๋ Hive ํ ์ด๋ธ์ ๋ํ ๋ช ๋ น์ ์ํํ๊ธฐ ์ํด์๋ [executeHive]๋ ธ๋๋ฅผ, Hive ํ ์ด๋ธ์ HDFS๋ก ๊ฐ์ ธ์ค๋ ๊ธฐ๋ฅ์ [hivetohdfs]๋ ธ๋๋ฅผ ์ฌ์ฉํ๋ค.
Example 1. query ์ ๋ ฅ
inputType์ query๋ก ์ ํํ ๊ฒฝ์ฐ ํ๋จ queryContent ๋ฐ์ค์ ์ง์ sql์ ์ ๋ ฅํ๋ค. ์ฟผ๋ฆฌ๋ด์ฉ์ด ๊ธธ ๊ฒฝ์ฐ ์ฐ์ธก [Query Editor]์ฐฝ ํด๋ฆญ์ ํ์ ๋ ์๋ํฐ์์ ์์ ํ ์ ์๋ค.
[fork]๋ ธ๋ example ์์ฑ์ ์ฌ์ฉํ "์์ธํน๋ณ์ ๋๊ธฐ์ค์ผ ์ธก์ ์ ๋ณด" ๋ฐ์ดํฐ(air_pollution)์ค ์ข ๋ก๊ตฌ ์์ฌ์ง ๊ด์ธก์์์ ์ธก์ ํ ๋ฐ์ดํฐ๋ง ์ถ์ถํด์ ์๋ก์ด ํ ์ด๋ธ "air_pollution_jongno"ํ ์ด๋ธ์ ๋ง๋ ๋ค. ํ ์ด๋ธ ์์ฑ์ ์ฌ์ฉํ query๋ ์๋์ ๊ฐ๋ค.
Example 2. script ํ์ฉ
์์ ํด์ผ ํ ์ฟผ๋ฆฌ๊ฐ ๋ง์ ๊ฒฝ์ฐ hql ๋ฑ์ ๋ฏธ๋ฆฌ ๋ง๋ค์ด ์ฌ์ฉํ ์ ์๋ค. inputType์ script๋ก ์ ํํ ๋ค์ ์ฌ์ ์ ์ค๋น๋ ์คํฌ๋ฆฝํธ๋ฅผ ์ ํํ๋ค.
[Note] ์ ์์ฌํญ
์คํํ ์คํฌ๋ฆฝํธ๋ฅผ hdfs์ ๋จผ์ ์ ์ฅํด์ผ ํ๋ค. HDFS ๋ธ๋ผ์ฐ์ ๋๋ ํฐ๋ฏธ๋์์ hadoop fs -put ๋ฑ์ ๋ช ๋ น์ด๋ฅผ ํ์ฉํ์ฌ ์ฌ์ ์ ๋ฑ๋กํ๋ค.