mlTrain
Definition
๊ธฐ ์ ์ฅ๋ ํ์ดํ๋ผ์ธ ๋๋ ์ ๊ท ํ์ดํ๋ผ์ธ์ ๋ฑ๋กํ์ฌ ml ํ์ต์ ์คํํ๋ ๋
ธ๋์
๋๋ค.
์ข์ธก [Flow๊ตฌ์ฑ]๋
ธ๋ ์ค [mlTrain]๋
ธ๋๋ฅผ drag & drop ํ ํ Property ํญ๋ชฉ์ ์
๋ ฅํฉ๋๋ค.
Property ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์
๋ ฅ๊ฐ๋ฅํ ์ ์ฒด Property ํญ๋ชฉ์ ๋ณผ ์ ์์ต๋๋ค.
Set
[setting], [scheduler], [parameter] ์ค์ ์ [์ํฌํ๋ก์ฐ] > [์์ฑ] > [๊ธฐ๋ณธ๊ตฌ์ฑ]์ ์ฐธ๊ณ ํฉ๋๋ค.
property
[Node Description] ์์ฑ ์ค์ธ ๋ ธ๋๋ช ์ ๋ ฅ
- modelName : ๋ชจ๋ธ๋ช ์ ๋ ฅ
- modelDesc : ๋ชจ๋ธ ์ค๋ช ์ ๋ ฅ
- pipelineId : ๊ธฐ์กด์ ํ์ดํ๋ผ์ธ ๋ชฉ๋ก ์ค ์ฌ์ฉํ ํ์ดํ๋ผ์ธ์ ์ ํํ๊ฑฐ๋ ์ ๊ท ํ์ดํ๋ผ์ธ์ ๋ฑ๋กํ์ฌ ์ฌ์ฉ
- datasetPath : ml train์ ์ํํ ๋ฐ์ดํฐ์ ๊ฒฝ๋ก (HDFS, S3 File browser์ ์ ๊ณต-ํ์ ์์ ํด๋น ๊ฒฝ๋ก๋ฅผ ์ ํ)
- format : ๋ฐ์ดํฐ์ ํฌ๋งท ์ ํ (parquet, csv, orc ์ค ์ ํ)
- datasetPathcredential : datasetPath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด (datasetPath ์ค์ ์ ์๋์ ํ ๋จ)
- modelPath : ํ์ต ์ฑ๊ณต ์ ๋ชจ๋ธ ์ ์ฅ ๊ฒฝ๋ก (HDFS, S3 File browser์ ์ ๊ณต-ํ์ ์์ ํด๋น ๊ฒฝ๋ก๋ฅผ ์ ํ)
- modelPathcredential : modelPath๊ฐ s3์ธ ๊ฒฝ์ฐ credential ์ ๋ณด (modelPath ์ค์ ์ ์๋์ ํ ๋จ)
- modelCluster : ํ์ต์ ์ฌ์ฉํ ํด๋ฌ์คํฐ๋ช (setting์ cluster ์ ํ ์ ์๋์ ํ ๋จ)
- spartOpts : spark ์ต์ ๋ฆฌ์คํธ ์ ๋ ฅ (key : --executor-memory , value : 20G)
Example
Property
Dataset๊ณผ ๋ชจ๋ธ ์ ์ฅ ์์น๋ฅผ HDFS ๋ธ๋ผ์ฐ์ ๋ก ์ฌ์ฉํ๋ ์์์ ๋๋ค.
- ์ ๊ท์์ฑ
- ๋ถ๋ฌ์ค๊ธฐ
์คํ ๊ฒฐ๊ณผ
[๋ธ๋ผ์ฐ์ ] > [HDFS] ๋ธ๋ผ์ฐ์ ์์ mlTrain ์คํ ๊ฒฐ๊ณผ๋ก ์ ์ฅ๋ ๋ชจ๋ธ์ ํ์ธ ํ ์ ์์ต๋๋ค.