mlPredict
Definition
ML Modeler์๋น์ค์์ ๊ธฐ ์ ์ฅ๋ ๋ชจ๋ธ์ ์คํํ๋ค. [Flow๊ตฌ์ฑ]๋ ธ๋ ์ค [mlPredict]๋ ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์ ๋ ฅํ๋ค. Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ ์์ฑ] > [์ค์ ]์ ์ฐธ๊ณ ํ๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- master : ml ์คํํ master ์ ํ (yarn-cluster, yarn-client, local ์ค ์ ํ)
- name : appName ์ ๋ ฅ
- datasetPath : ml predict์ ์ํํ ๋ฐ์ดํฐ์ ๊ฒฝ๋ก
- datasetPathcredential : datasetPath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด
- dataSetFormat : ๋ฐ์ดํฐ์ ํฌ๋งท ์ ํ (parquet, csv, orc ์ค ์ ํ)
- dataSetDelimiter : ๋ฐ์ดํฐ์ ๊ตฌ๋ถ์ ์ ๋ ฅ
- dataSetHeaderExists : ๋ฐ์ดํฐ๋ท header๊ฐ ์๋์ง ์ฌ๋ถ (TRUE, FALSE ์ค ์ ํ)
- useTrainNodeModel : ์ฐ๊ฒฐ๋ mlTrain ๋ ธ๋์ ํ์ต๊ฒฐ๊ณผ ๋ชจ๋ธ ์ฌ์ฉ ์ฌ๋ถ
- modelPath : ๋ชจ๋ธ ๊ฒฝ๋ก (ํ์ ์ด๊ธฐ : HDFS, S3 File browser ํ์ ์์ ๋ชจ๋ธ ๊ฒฝ๋ก๋ฅผ ์ ํ, ml model ๋ถ๋ฌ์ค๊ธฐ : ๊ธฐ์กด์ ๋ฑ๋ก๋ model์ ์ ํ)
- modelPathcredential : modelPath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด
- selectedColumns : ๊ฐ์ ธ์ฌ ์ปฌ๋ผ ์ ํ (Dataset(๊ฒฐ๊ณผ)์คํค๋ง ๋ถ๋ฌ์ค๊ธฐ ๋ฒํผ์ผ๋ก ๋ถ๋ฌ์ค๊ฑฐ๋ ์ง์ ์ ๋ ฅ ๊ฐ๋ฅ)
- savePath : ์ ์ฅํ ๊ฒฝ๋ก ์ ํ
- savePathcredential : savePath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด
- saveDataSetFormat : ์ ์ฅํ ๋ฐ์ดํฐ์ ํฌ๋งท ์ ํ (parquet, csv, orc ์ค ์ ํ)
- saveDataSetDelimiter : ์ ์ฅํ ๋ฐ์ดํฐ์ ๊ตฌ๋ถ์ ์ ๋ ฅ
- saveDataSetHeaderExists : ์ ์ฅํ ๋ฐ์ดํฐ์ header๊ฐ ์๋์ง ์ฌ๋ถ (TRUE, FALSE ์ค ์ ํ)
- sparkOpts : spark ์ต์ ๋ฆฌ์คํธ ์ ๋ ฅ (ex. key : --executor-memory , value : 20G)
- forceOK : ์คํจ ์ ๊ฐ์ OK ์ฒ๋ฆฌ ์ฌ๋ถ
Example
Property
HDFS ๋ธ๋ผ์ฐ์ ๋ฅผ ์ฌ์ฉํ๋ ์์์ ๋๋ค.
์คํ ๊ฒฐ๊ณผ
๋ธ๋ผ์ฐ์ > HDFS ๋ธ๋ผ์ฐ์ ์์ mlPredict ์คํ ๊ฒฐ๊ณผ๋ก ์ ์ฅ๋ ๋ฐ์ดํฐ์ ์ ํ์ธ ํ ์ ์๋ค.