mlPredict

Definition

ML Modeler์„œ๋น„์Šค์—์„œ ๊ธฐ ์ €์žฅ๋œ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•œ๋‹ค. [Flow๊ตฌ์„ฑ]๋…ธ๋“œ ์ค‘ [mlPredict]๋…ธ๋“œ๋ฅผ drag & drop ํ•œ ํ›„ Property ํ•ญ๋ชฉ์„ ์ž…๋ ฅํ•œ๋‹ค. Property ํŒจ๋„์˜ [๋”๋ณด๊ธฐ+] ๋ฒ„ํŠผ์„ ๋ˆ„๋ฅด๋ฉด ์ž…๋ ฅ๊ฐ€๋Šฅํ•œ ์ „์ฒด Property ํ•ญ๋ชฉ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

Set

[setting], [scheduler], [parameter] ์„ค์ •์€ [์›Œํฌํ”Œ๋กœ์šฐ ์ƒ์„ฑ] > [์„ค์ •]์„ ์ฐธ๊ณ ํ•œ๋‹ค.

property

[Node Description] ์ž‘์„ฑ ์ค‘์ธ ๋…ธ๋“œ๋ช… ์ž…๋ ฅ

flow012

  1. master : ml ์‹คํ–‰ํ•  master ์„ ํƒ (yarn-cluster, yarn-client, local ์ค‘ ์„ ํƒ)
  2. name : appName ์ž…๋ ฅ
  3. datasetPath : ml predict์„ ์ˆ˜ํ–‰ํ•  ๋ฐ์ดํ„ฐ์…‹ ๊ฒฝ๋กœ
  4. datasetPathcredential : datasetPath๊ฐ€ s3์ธ ๊ฒฝ์šฐ credential ์ •๋ณด
  5. dataSetFormat : ๋ฐ์ดํ„ฐ์…‹ ํฌ๋งท ์„ ํƒ (parquet, csv, orc ์ค‘ ์„ ํƒ)
  6. dataSetDelimiter : ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ๋ถ„์ž ์ž…๋ ฅ
  7. dataSetHeaderExists : ๋ฐ์ดํ„ฐ๋„ท header๊ฐ€ ์žˆ๋Š”์ง€ ์—ฌ๋ถ€ (TRUE, FALSE ์ค‘ ์„ ํƒ)
  8. useTrainNodeModel : ์—ฐ๊ฒฐ๋œ mlTrain ๋…ธ๋“œ์˜ ํ•™์Šต๊ฒฐ๊ณผ ๋ชจ๋ธ ์‚ฌ์šฉ ์—ฌ๋ถ€
  9. modelPath : ๋ชจ๋ธ ๊ฒฝ๋กœ (ํŒ์—…์—ด๊ธฐ : HDFS, S3 File browser ํŒ์—…์—์„œ ๋ชจ๋ธ ๊ฒฝ๋กœ๋ฅผ ์„ ํƒ, ml model ๋ถˆ๋Ÿฌ์˜ค๊ธฐ : ๊ธฐ์กด์— ๋“ฑ๋ก๋œ model์„ ์„ ํƒ)
  10. modelPathcredential : modelPath๊ฐ€ s3์ธ ๊ฒฝ์šฐ credential ์ •๋ณด
  11. selectedColumns : ๊ฐ€์ ธ์˜ฌ ์ปฌ๋Ÿผ ์„ ํƒ (Dataset(๊ฒฐ๊ณผ)์Šคํ‚ค๋งˆ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ ๋ฒ„ํŠผ์œผ๋กœ ๋ถˆ๋Ÿฌ์˜ค๊ฑฐ๋‚˜ ์ง์ ‘ ์ž…๋ ฅ ๊ฐ€๋Šฅ)
  12. savePath : ์ €์žฅํ•  ๊ฒฝ๋กœ ์„ ํƒ
  13. savePathcredential : savePath๊ฐ€ s3์ธ ๊ฒฝ์šฐ credential ์ •๋ณด
  14. saveDataSetFormat : ์ €์žฅํ•  ๋ฐ์ดํ„ฐ์…‹ ํฌ๋งท ์„ ํƒ (parquet, csv, orc ์ค‘ ์„ ํƒ)
  15. saveDataSetDelimiter : ์ €์žฅํ•  ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ๋ถ„์ž ์ž…๋ ฅ
  16. saveDataSetHeaderExists : ์ €์žฅํ•  ๋ฐ์ดํ„ฐ์…‹ header๊ฐ€ ์žˆ๋Š”์ง€ ์—ฌ๋ถ€ (TRUE, FALSE ์ค‘ ์„ ํƒ)
  17. sparkOpts : spark ์˜ต์…˜ ๋ฆฌ์ŠคํŠธ ์ž…๋ ฅ (ex. key : --executor-memory , value : 20G)
  18. forceOK : ์‹คํŒจ ์‹œ ๊ฐ•์ œ OK ์ฒ˜๋ฆฌ ์—ฌ๋ถ€

Example

Property

HDFS ๋ธŒ๋ผ์šฐ์ €๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.

flow012

์‹คํ–‰ ๊ฒฐ๊ณผ

๋ธŒ๋ผ์šฐ์ € > HDFS ๋ธŒ๋ผ์šฐ์ € ์—์„œ mlPredict ์‹คํ–‰ ๊ฒฐ๊ณผ๋กœ ์ €์žฅ๋œ ๋ฐ์ดํ„ฐ์…‹์„ ํ™•์ธ ํ•  ์ˆ˜ ์žˆ๋‹ค.

flow012