pivot
Definition
์ด์ ํผ๋ฒํ์ฌ ์ง์ ๋ ์ง๊ณํจ์๋ฅผ ์ํํฉ๋๋ค.
์ข์ธก [๋ฐ์ดํฐ์ฒ๋ฆฌ(๊ธฐ๋ณธ)]๋
ธ๋ ์ค [pivot]๋
ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์
๋ ฅํฉ๋๋ค.
Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์
๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์์ต๋๋ค.
Set
[setting], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ] > [์์ฑ] > [๊ธฐ๋ณธ๊ตฌ์ฑ]์ ์ฐธ๊ณ ํฉ๋๋ค.
Property
[Node Description] ์์ฑ ์ค์ธ ๋
ธ๋๋ช
์
๋ ฅ
- groupBy : ๊ทธ๋ฃนํ ๊ธฐ์ค ์ปฌ๋ผ ์ ํ
- pivot_col : ํผ๋ฒํ ์ปฌ๋ผ ์ ํ
- value : value ๊ฐ ์ ๋ ฅ
- func : ์ง๊ณ์ ์ฌ์ฉํ ํจ์(max, min, avg, count, sum) ์ ํ
- target_col : ์ง๊ณ ๊ธฐ์ค ์ปฌ๋ผ ์ ํ
- overwriteSchema : pivot ๋ ธ๋ ์คํ๊ฒฐ๊ณผ ์คํค๋ง๋ฅผ ์ฌ์ ์(์ฒดํฌํ์ง ์์ ๊ฒฝ์ฐ ๊ธฐ์กด ์คํค๋ง ์ฌ์ฌ์ฉ)
- newSchema : pivot ๋ ธ๋ ์คํ๊ฒฐ๊ณผ๋ฅผ ์ ์ฅํ ์๋ก์ด ์คํค๋ง ์์ฑ
Example
์๋น์๋ณ(group) ๊ฐ์ฅ ๋ง์ ๋น์ฉ์ ์ง๋ถํ ๊ตฌ์ ํ๋ชฉ์ ์ ๋ฆฌํฉ๋๋ค. ์๋ก ๋ง๋ค์ด์ง๋ ํผ๋ฒํ ์ด๋ธ์์ ํ์๋ category(groupBy), ์ด์๋ group(pivot_col)์ด ์์นํ๋ฉฐ, MAX(price)๊ฐ์ ๋ณด์ฌ์ค๋๋ค.
- [HDFS๋ถ๋ฌ์ค๊ธฐ], [dropna], [pivot] ๋ ธ๋๋ฅผ Designer์ Drag & Dropํ์ฌ ์ํฌํ๋ก์ฐ ์์ฑ
- [pivot] ๋ ธ๋๋ฅผ ์๋์ ๊ฐ์ด ์ค์ ํ๊ณ snapshot์ ํด๋ฆญ
snapshot ํด๋ฆญ์ ์๋ฌ๋ฐ์ํ์ฌ ์ด๋ฏธ์ง ์บก์ฒ ์คํจ. ์ฌ์์ ํ์