AutoML
Accu.Tuning ๊ฐ์
1. Accu.Tuning ์๊ฐ ๋ฐ ์ฃผ์๊ธฐ๋ฅ
Accu.Tuning์ Parameter ํจ๊ป ์ฝ๋ฉ ์์ด๋ ์๋์ผ๋ก ์ต์ ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฐพ์๋ณด์ธ์. ๋ฐ์ดํฐ ๋ถ์ ์ ๋ฌธ๊ฐ๊ฐ ์๋๋๋ผ๋ ์ฌ์ฉํ ์ ์๋ Accu.Tuning์ ํตํด ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ๊ณผ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋น ๋ฅด๊ฒ ์ ์ฉํด๋ณผ ์ ์์ต๋๋ค. ๋ณต์กํ ๋ฐ์ดํฐ ๋ถ์์ ์์๋๋ ์๊ฐ์ ์ค์ด๊ณ , ๋ถ์ ์ฑ๋ฅ์ ๋์ฌ๋ณด์ธ์. TPOT, Auto-sklearn ๋ฑ ๋ค์ํ ์คํ์์ค AutoML ํ๋ ์์ํฌ๋ฅผ ๊ต์ฐจ ํ์ฉํ์ฌ ๊ทธ ์ฑ๋ฅ์ ๋์ด๊ณ , ๋ค์ํ ์ฐ์ ๊ตฐ๊ณผ ํ๊ทยท๋ถ๋ฅ ๋ฑ ์ด๋ ์์ธก ๋ชฉ์ ์๋ ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค. ๋ถ์์ด ๋๋ ๋ชจ๋ธ๋ AccuInsight+๋ Scikit-Learn ๋ฑ์ผ๋ก ๋น ๋ฅด๊ฒ ๋ฐฐํฌํ์ฌ, ์ฝ๊ฒ ๊ฐ๊ณตํ๊ณ ํ์ฉํ ์ ์์ต๋๋ค.
(1) Preprocessor : ๋ด ๋ฐ์ดํฐ์์ ๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ, ๋ผ๋ฒจ๋ง ๋ฑ ๋ณต์กํ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๊ฐํธํ๊ฒ ์ฒ๋ฆฌํ๊ณ AutoML์ ๋ง๋ ๋ฐ์ดํฐ์ ์ ์๋์ผ๋ก ๊ตฌ์ฑํด๋ณด์ธ์.
(2) Modeler : ์ ์ํ ๋ฌธ์ ์ ๋ฐ๋ผ TPOT, Auto-sklearn ๋ฑ ์คํ์์ค AutoML ํ๋ ์์ํฌ๋ฅผ ์ด์ฉํ ์ต์ ์ ๋ชจ๋ธ๊ณผ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๊ณ , API๋ฅผ ํตํด AccuInsight+ ๋ฑ์ผ๋ก ๋ฐ๋ก ๋ฐฐํฌํ ์ ์์ต๋๋ค.
(3) Deploy : ๊ตฌ์ฑ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ ๋ค์ํ ์งํ๋ก ๋น๊ตํ์ฌ ์ต์ ์ ๋ชจ๋ธ์ ์ ์ ํ๊ณ , ์ค๋ช ๊ฐ๋ฅํ AI ๊ธฐ์ ์ ํตํด ๋ด ๋ชจ๋ธ์ ์๋ฏธ๊ฐ ๋ฌด์์ธ์ง ํ์ ํ ์ ์๋๋ก ํฉ๋๋ค.
2. ์ฐธ๊ณ
Accu.Tuning์ hyperparameter ์ต์ ํ ์์ง์ผ๋ก Optuna๋ฅผ ์ฌ์ฉํ์์ผ๋ฏ๋ก Optuna์ ๋ํ ๊ธฐ๋ณธ ์ง์์ด ์์ผ๋ฉด ๋งค๋ด์ผ์ ์ดํดํ๋๋ฐ ๋ง์ ๋์์ด ๋ฉ๋๋ค.
Optuna Document๋ ์๋์ ๊ฒฝ๋ก๋ฅผ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค.
Experimemts
Experiment๋, ์ฌ์ฉ์๊ฐ ๋ถ์ํ๊ณ ์ถ์ ํ๋์ ๊ณผ์ ๋ฅผ ์๋ฏธํฉ๋๋ค. ํ Experiment์๋ ํ๋์ Data Source๋ฅผ ์ถ๊ฐํ ์ ์์ต๋๋ค.
- ์๋ก์ด ์คํ์ ์์ฑํฉ๋๋ค.
- ํ์ฌ ์์ฑ๋์ด ์๋ ์คํํญ๋ชฉ๋ค์ ๋ณผ ์ ์์ต๋๋ค.
- ์์ฑ๋ ์คํ์ ์์/์ ์ง/์ญ์ ๋ฅผ ํ ์ ์์ต๋๋ค.
1. ์ Experiment ๋ง๋ค๊ธฐ
์ฌ์ฉ์๊ฐ ๊ฐ์ง๊ณ ์๋ ๋ฐ์ดํฐ ํ์ผ์ Accu.Tuning์ผ๋ก ์ ๋ก๋ ํ๋๋ค. ๋ํ From the URL ํญ๋ชฉ์ ํตํด AccuInsight+์ ๋ฐ์ดํฐ๋ฅผ ์ ๋ก๋ ํ ์ ์์ต๋๋ค.
- ์๋ก์ด ์คํ์ ์์ฑํฉ๋๋ค.
- ์ฌ์ ์ ๋ง๋ค์์๋ ํ์ผ๋ค๋ก ์คํ์ ์์ฑํ ์ ์์ต๋๋ค.
- ์๋ก์ด ํ์ผ์ ์ ๋ก๋ ํ์ฌ ์คํ์ ์งํํ ์ ์์ต๋๋ค.
Overview
Overview ํญ์์ Estimator type, target ๋ฑ์ ๋ถ์ ์ค์ ์ ์ํํ๊ณ , Source Preview์ Source Columns ์์ ๋ฐ์ดํฐ ๋ถํฌ๋ฅผ ํ์ธํฉ๋๋ค.
1. AutoML ์ต์ ์ค์ ํ๊ธฐ
- ๊ฐ ํ๋ก์ธ์ค๊ฐ ์์๋๋ก ์์ต๋๋ค.
- Overview์์ ์ค์ ํ ์ ์๋ ์ต์ ์ ๋๋ค.
- ๋ฉ์ธ ์ต์ ๋ค์ ์ค์ ํ ํ AutoML์ ๋ฐ๋ก ์คํํ ์ ์์ต๋๋ค.
- ๋ถ๋ฅ/ํ๊ท ๋ฌธ์ ์ ํ๊ฒ ๋ณ์, ๋ฐํ์ ์ ํ, Framework ์ ํ, ์ปจํ ์ด๋ ๊ฐ์๋ฅผ ์ค์ ํ ์ ์์ต๋๋ค.
- ํ๊ฐํจ์, ์ต๋ํ๊ฐํ์, ๋ฆฌ์ํ๋ง์ ๋ต, ํด๋ ๊ฐ์, Test ์ ์ ๋น์จ์ ์ค์ ํ ์ ์์ต๋๋ค.
- ๋ฐ์ดํฐ์ ๋ณํ ๋ฐ ํผ์ณ ์์ง๋์ด๋ง์ ์ค์ ํ ์ ์์ต๋๋ค.
- ์ํ๋ ๋ชจ๋ธ์ ์ค์ ํ์ฌ Accu.Tuning๋ฅผ ์คํํฉ๋๋ค.
- ์ถ๊ฐ ์คํ์ ์งํํ๊ฑฐ๋ ๋ชจ๋ ์ ๋ณด๋ฅผ ๋ฏธ๋ฆฌ ์์ฑํฉ๋๋ค.
2. ๋ฐ์ดํฐ ๋ถํฌ ํ์ธ ํ์ธํ๊ธฐ
- ํ ์ด๋ธ ๋ฏธ๋ฆฌ๋ณด๊ธฐ์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
Preprocess
- Preprocess์์ ์งํํ ์ ์ฒ๋ฆฌ๋ฅผ ์์ฐจ์ ์ผ๋ก ๋ณผ ์ ์์ต๋๋ค.
- Accu.Tuning์ Preprocess ์ถ์ฒ, ๋ณ์๋ค๊ฐ์ ์๊ด๋ถ์์ ๋ณผ ์ ์์ต๋๋ค.
- ๊ฐ ๋ณ์๋ฅผ ์ ํํ๊ณ , ํ์ ๋ณํ๊ณผ ์ด์์น์ ๊ฑฐ, ๋ถํฌ๋ณํ์ ํ ์ ์์ต๋๋ค.
Leaderboard
Accu.Tuning ๋ชจ๋ธ์ ์ ์์ ๋ณ์์ ์ค์๋ ๋ฑ์ ๋ณผ ์ ์์ต๋๋ค.
- ๋ณ์์ ์ค์๋, Lime, ํ๋ผ๋ฏธํฐ ์ ๋ณด, ๋ค๋ฅธ Metrics๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
- ์ ์๊ฐ ์ ์ฌํ๊ณ ๊ฐ์ ๋ชจ๋ธ์ ํผ์ณ์ ๋ณผ ์ ์์ต๋๋ค.
- ํด๋น๋ชจ๋ธ์ Deployํ์ฌ ๋ค์ด๋ก๋ ํ ์ ์์ต๋๋ค.
Deployment
- Deployํ ๋ชจ๋ธ์ ์ ๋ณด๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
- Test data๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
- ์์ฑ๋ ๋ชจ๋ธ๋ก Test data๋ฅผ ์ ๋ ฅํ์ฌ ์์ธกํฉ๋๋ค.
1. Model ์ ๋ณด ํ์ธํ๊ธฐ
- Binary ๋ชจ๋ธ ํ์ผ์ ๋ค์ด๋ก๋ ๋ฐ๊ณ , ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ค๋ช ์ ๋๋ค.
- ๋ชจ๋ธ์ PipeLine์ ๋ณผ ์ ์์ต๋๋ค.
- ์ฌ๋ฌ๊ฐ์ง Metrics๋ค์ ๋ณด๊ณ ๋ชจ๋ธ์ ํ๊ฐ ๋ฐ ํด์ํ ์ ์์ต๋๋ค.
- ๋ณ์ ์ค์๋, ์์ฐจ๋, ์์ธก์ค๋ฅ์ ๋ํด์ ๋ณผ ์ ์์ต๋๋ค.
2. Model์ ๋ด๋ ค๋ฐ์ ์ฌ์ฉํ๊ธฐ
- Binary ๋ชจ๋ธ ํ์ผ์ ๋ค์ด๋ก๋ ๋ฐ์ต๋๋ค.
- autoinsight-helpsers package๋ฅผ ๋ค์ดํ ํ, ๋ชจ๋ธ piepline์ ๋ถ๋ฌ์ค๋ ์์ค์ฝ๋๊ฐ ์๋ ํด๋์ ์์ถ์ ํ๋๋ค.
- ์๋ ์์ค์ฝ๋์ ๊ฐ์ด ๋ชจ๋ธ piepline์ ๋ณผ๋ฌ์ต๋๋ค.