mlTrain
Definition
ML Modeler์๋น์ค์์ ๊ธฐ ์ ์ฅ๋ ํ์ดํ๋ผ์ธ์ ์ฌ์ฉํ์ฌ ml ํ์ต์ ์คํํ๋ ๋ ธ๋์ด๋ค. [Flow๊ตฌ์ฑ]๋ ธ๋ ์ค [mlTrain]๋ ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์ ๋ ฅํ๋ค. Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ ์์ฑ] > [์ค์ ]์ ์ฐธ๊ณ ํ๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- modelName : ๋ชจ๋ธ๋ช ์ ๋ ฅ
- modelDesc : ์ค๋ช ์ ๋ ฅ
- pipelineId : ๋ธ๋ผ์ฐ์ ์์ ๊ธฐ์กด์ ํ์ดํ๋ผ์ธ ๋ชฉ๋ก ์ค ์ฌ์ฉํ ํ์ดํ๋ผ์ธ์ ์ ํ
- datasetPath : ml train์ ์ํํ ๋ฐ์ดํฐ์ ๊ฒฝ๋ก (HDFS, S3 File browser์ ์ ๊ณต-ํ์ ์์ ํด๋น ๊ฒฝ๋ก๋ฅผ ์ ํ)
- format : ๋ฐ์ดํฐ์ ํฌ๋งท ์ ํ (parquet, csv, orc ์ค ์ ํ)
- datasetPathcredential : datasetPath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด (datasetPath ์ค์ ์ ์๋์ ํ ๋จ)
- modelPath : ํ์ต ์ฑ๊ณต ์ ๋ชจ๋ธ ์ ์ฅ ๊ฒฝ๋ก (HDFS, S3 File browser์ ์ ๊ณต-ํ์ ์์ ํด๋น ๊ฒฝ๋ก๋ฅผ ์ ํ)
- modelPathcredential : modelPath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด (modelPath ์ค์ ์ ์๋์ ํ ๋จ)
- modelCluster : ํ์ต์ ์ฌ์ฉํ ํด๋ฌ์คํฐ๋ช (setting์ cluster ์ ํ ์ ์๋์ ํ ๋จ)
- spartOpts : spark ์ต์ ๋ฆฌ์คํธ ์ ๋ ฅ (key : --executor-memory , value : 20G)
Example
Property
HDFS ๋ธ๋ผ์ฐ์ ๋ฅผ ์ฌ์ฉํ๋ ์์์ ๋๋ค.
์คํ ๊ฒฐ๊ณผ
๋ธ๋ผ์ฐ์ > HDFS ๋ธ๋ผ์ฐ์ ์์ mlTrain ์คํ ๊ฒฐ๊ณผ๋ก ์ ์ฅ๋ ๋ชจ๋ธ์ ํ์ธ ํ ์ ์๋ค.