select
Definition
ํ์ ์ปฌ๋ผ๋ง ์ ํํ์ฌ ์กฐํํ๋ ๋ ธ๋์ด๋ค. ์ปฌ๋ผ ์ ํ ์์์ ๋ฐ๋ผ ๋ ธ์ถ ์์๊ฐ ์ ์ฉ๋๋ค. ํ์ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ฏ๋ก ๋ ธ์ถ์์๋ฅผ ํ์ธํ ์ ์๋ค. ์ข์ธก [๋ฐ์ดํฐ์ฒ๋ฆฌ(๊ธฐ๋ณธ)]๋ ธ๋ ์ค [select]๋ ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์ ๋ ฅํ๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ ์์ฑ] > [์ค์ ]์ ์ฐธ๊ณ ํ๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- col : ์ ์ฉํ column ์ ํ. ์๋ 2๊ฐ์ง ๋ฐฉ๋ฒ ์ง์
- ์ฐ์ธก ์์ ๋ฒํผ ํ์ฉํ์ฌ ํ์ ์ปฌ๋ผ ์ ํ
- ๋๋กญ๋ค์ด ๋ฒํผ์์ ํ์ ์ปฌ๋ผ ์ ํ
Example
Sample ๋ฐ์ดํฐ๋ก ์ฌ์ฉ์ค์ธ ์ํ์ ๋ณด์์ ํ์ํ ์ปฌ๋ผ(goods_id, category, price, shop_id)๋ง ์ ํํ๋ ์ํฌํ๋ก์ฐ๋ฅผ ์์ฑํ๋ค(์คํํด๋ฌ์คํฐ : kbtest).
hdfs์ ์ ์ฌ๋ ํ์ผ(goods-sample2.csv)์ [HDFS๋ถ๋ฌ์ค๊ธฐ]๋ก ๋ถ๋ฌ์จ๋ค. ์ ๋ ฅ์ ๋ณด๋ ์๋์ ๊ฐ๋ค.
property input data 1.file hdfs://kbtest-accu-hdfs-nn.suka:9000/tmp/goods-sample2.csv 2.format csv 3.delimiter , 4.sampling 100% 11.schema ์๋ํ์ฑ [HDFS๋ถ๋ฌ์ค๊ธฐ] ์์ ์์ ๋ง๋ค์ด์ง ETL ๋ ธ๋ ๋ด๋ถ์ [select]๋ ธ๋๋ฅผ drag & drop ํ ํ ๋ ๋ ธ๋๋ฅผ ์ฐ๊ฒฐํ๋ค.
- [select]๋ ธ๋ "1.col" property์์ ๋๋กญ๋ค์ด ๋ฒํผ์ ๋๋ฌ ํ์ํ ์ปฌ๋ผ์ ์ ํํ๋ค(์ฐ์ธก [์์ ] ๋ฒํผ ํด๋ฆญ ํ ์ ํํด๋ ๋ฌด๋ฐฉ).
select ๋ ธ๋์์ ์ค๋ ์ท์ ๋ณด์ ์คํค๋ง์ ๋ณด๋ฅผ ํ์ธํ๋ค.
์ค๋ ์ท ์ ๋ณด
๋ ธ๋ ์คํค๋ง ์ ๋ณด
Troubleshooting
- ํด๋ฌ์คํฐ [OOO]์ ์ธ์ ์ํ๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.(์ค์ > ์ธ์ ๊ด๋ฆฌ)
Apache Livy ์ธ์ ์ด ์ข ๋ฃ๋๊ฑฐ๋, ํด๋ฌ์คํฐ ๋ด ๊ฐ์ฉ Memory๋ฅผ ๋ค์ ์ ์ ํ๊ณ ์์ด ์ํฌํ๋ก์ฐ ์คํ์ด ์ด๋ ค์ธ ๊ฒฝ์ฐ ์์ ๊ฐ์ ๋ฉ์์ง๊ฐ ๋ํ๋ ์ ์๋ค. ์๋์ ๊ฐ์ด ์กฐ์นํ๋ค.
1> [์ค์ ] > [์ธ์ ๊ด๋ฆฌ]์์ ์ธ์ ์ํ์ ๋ณด๋ฅผ ํ์ธํ๋ค. [NONE], [DEAD] ์ํ์ผ ๊ฒฝ์ฐ ๊ธฐ๋ฅ ํ๋์์ [์ธ์ ์์ฑ] ๋ฒํผ์ ๋๋ฌ Livy Seseeion์ ์์ฑํ๋ค.
2> ์ํ์ ๋ณด๊ฐ [IDLE]์ผ ๊ฒฝ์ฐ Livy Session์ ๋ ์์ผ๋, ํ์ฌ ์์ ์ค ๋๋ ์์ ์๋ฃ ํ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ฐํํ์ง ์์ ์ํ์ด๋ค. ์๋์ ๊ฐ์ด ์์ ์ํ๋ฅผ ๋จผ์ ํ์ธํ๋ค.
- [DHP] > [CLUSTER] > ์์ ํด๋ฌ์คํฐ๋ช > [APPL HISTORY] ์ผ๋ก ์ด๋ ํ ID๋ณ ์์ ์ํ(State, Final State)์ ๋ณด๋ฅผ ํ์ธํ๋ค.
- "bpSession"์ ์ ์ธํ ๋ค๋ฅธ ์์ ๋ค์ด ์ข ๋ฃ์ํ๋ผ๋ฉด [์ธ์ ๊ด๋ฆฌ]์์ [์ธ์ ์ญ์ ] ํ [์ธ์ ์์ฑ] ์์ ์ ์ํํ๋ค.