customCode
customCode
PySpark์ DataFrame ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์ ์ ์ ์ฝ๋๋ฅผ ์ ๋ ฅ ํ ์ ์๋ค. ์ข์ธก [๋ฐ์ดํฐ์ฒ๋ฆฌ(๊ณ ๊ธ)]๋ ธ๋ ์ค [customCode]๋ ธ๋๋ฅผ drag & drop ํ๋ค. Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
dataset ๋ณ๊ฒฝ ๊ฐ๋ฅ (1์ค ์ ๋ ฅ๋ง ๊ฐ๋ฅ) ex. withColumn('temp_filled_spark', filled_column)
code PySpark์ DataFrame ํจ์ 1์ค ์ ๋ ฅ overwriteSchema ์คํ ๊ฒฐ๊ณผ์ ๋ํ ๋ฐ์ดํฐ ์คํค๋ง ์ ์ฅ ์ฌ๋ถ
- code : Dataframe์์ ์ฌ์ฉ ๊ฐ๋ฅํ ํจ์๊ฐ ํฌํจ๋ ์ฝ๋(filter(), drop(), limit() ๋ฑ) ์์ฑ
- variableName : ๋ณ์๋ช ์ ๋ ฅ
- variableType : ๋ณ์ํ์ ์ ๋ ฅ
- overwriteSchema : ์คํ๊ฒฐ๊ณผ์ ๋ํ ์คํค๋ง๋ฅผ ์ฌ์ ์(์ฒดํฌํ์ง ์์ ๊ฒฝ์ฐ ์ด์ ์คํค๋ง๋ฅผ ๊ทธ๋๋ก ์ฌ์ฉํจ)
- newSchema