Scheduler
Scheduler
Scheduler ํจ๋์ ํด๋ฆญํ๋ฉด ํ๋จ ํจ๋์ด ํ์ฅ๋๋ค. Scheduler ํจ๋์ [๋๋ณด๊ธฐ+] ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ ฅ๊ฐ๋ฅํ ์ ์ฒด ํญ๋ชฉ์ ๋ณผ ์ ์๋ค.
enable : enable ํญ๋ชฉ์ ์ฒดํฌํ ๊ฒฝ์ฐ scheduler ํจ๋์์ ์ค์ ํ ์ฌํญ์ ๋ง๊ฒ ์ํฌํ๋ก์ฐ job์ ์คํํ๋ค.
timezone : timezone ์ค์ ํ ์ ์์ผ๋ฉฐ ๊ธฐ๋ณธ๊ฐ์ kst ์ด๋ค.
start : ์์ ์ผ์๋ฅผ ์ค์ ํ ์ ์๋ค(์์ ์ผ์๋ ํ์ฌ ์ผ์ ๋ณด๋ค ์ดํ๋ก ์ง์ ํด์ผ ํ๋ค).
end : ์ข ๋ฃ ์ผ์๋ฅผ ์ค์ ํ ์ ์๋ค.
frequency : Time Interval ๊ธฐ๋ฐ์ผ๋ก ์ํฌํ๋ก์ฐ job์ ์คํํ๋ค. Basic, Cron ๋ฑ ๋ ๊ฐ์ง InputType์ ์ ๊ณตํ๋ค.
- InputType์ Basic์ผ๋ก ์ ํํ ๊ฒฝ์ฐ frequencyNumber์ ์คํ์ฃผ๊ธฐ(์ซ์๊ฐ), frequencyUnit์ minutes, hours, days, months ์ค ์ ํ ํ์ฌ ์ฃผ๊ธฐ๋ฅผ ์ค์ ํ ์ ์๋ค. frequencyUnit์ minutes๋ก frequencyNumber๋ฅผ 5๋ก ์ ๋ ฅํ ๊ฒฝ์ฐ 5๋ถ ์ฃผ๊ธฐ๋ก ์ํฌํ๋ก์ฐ job์ ์คํํ๊ฒ ๋ค๋ ์๋ฏธ์ด๋ค. ์ํฌํ๋ก์ฐ ์คํ์ ์ต์์ฃผ๊ธฐ๋ 5๋ถ์ผ๋ก ๊ทธ ์ดํ๋ก ์ค์ ํ ์ ์๋ค.
- InputType์ด Cron์ด๋ฉด Unix Crontab ์คํ์ผ๋ก ์ค์ผ์ค์ ์ค์ ํ ์ ์๋ค. ํ์ผ 10๋ถ ๋ง๋ค ์ํฌํ๋ก์ฐ๊ฐ ์คํ๋๋ค๋ฉด [0/10 ? 1-5 *]๊ณผ ๊ฐ์ด ์ ๋ ฅํ๋ค.
controls : timeout, concurrency, throttle, execution ์ ์ค์ ํ ์ ์๋ค.
- timeout : ํ์์์ ์๊ฐ์ ์ค์ ํ๋ค. default๋ -1์ด๋ค.
timeout ์ค๋ช -1 timeout ๋ฏธ์ค์ . ์ฆ ์ํฌํ๋ก์ฐ ์์ ์ด ๊ฐ๋ฅํ ๋๊น์ง ๋ฌดํ์ ๋๊ธฐํจ 0 workflow๊ฐ ์ ์์ ์ด์ง ์์ ๊ฒฝ์ฐ ์ฆ์ ์ข ๋ฃํจ - concurrency : ๋์์ ์คํ(running)์ํค๋ ์์ ์
- throttle : ํน์ ์์ ์ ์คํ ๋๊ธฐ(waiting) ์ค์ธ ์์ ์
- execution : ์ธ์คํด์ค๋ค์ ์คํ ๊ท์น์ ์ค์
execution ์ค๋ช FIFO ์์๋๋ก ์คํ LIFO ๊ฐ์ฅ ๋์ค์ ๋ค์ด์จ ๊ฒ๋ถํฐ ์คํ ONLYLAST ๋ง์ง๋ง ์์ ๋ง ์คํํ๊ณ ๋๋จธ์ง ์์ ์ ์คํํ์ง ์์ datasets : ๋ฏธ๋ฆฌ ์์ฑํด๋ dataset์ ๋ถ๋ฌ์์ ํ์ผ์ด ์กด์ฌํ๊ฑฐ๋ ๋๋ ํ ๋ฆฌ ๋ค์ด๋ฐ ๊ท์น ๋ฑ์ผ๋ก ์กฐ๊ฑด์ ๋ฐ๋ฅธ ์ค์ผ์ค์ ์ค์ ํ ์ ์๋ค.
โข inputEvents
- name: input-dataset ์ด๋ฆ
- uriTemplate: dataset์ด ์์นํ HDFS ๊ฒฝ๋ก
- frequency: ์ํ ์ฃผ๊ธฐ (minutes, hours, days, months ์ค ํ1)
- initialInstance: ์ฒซ๋ฒ์งธ ์ธ์คํด์ค ์์ (ํด๋น ์์ ์ด์ ์ ์์ฑ๋ ์ธ์คํด์ค๋ ๋ฌด์)
- timezone: timezone ์ ๋ณด
- doneFlag: ํ๋๋ฅผ ํตํด์ ์ฝ๋๋ค์ดํฐ๊ฐ ํด๋น ๋ฐ์ดํฐ์ ์ด ์ฒ๋ฆฌํ ์ค๋น๊ฐ ๋์๋์ง๋ฅผ ์๋ ค์ค(_SUCCESS, DIRECTORY ์ค ํ1)
โข outputEvents
- name: output-dataset ์ด๋ฆ
- uriTemplate: dataset์ด ์์นํ HDFS ๊ฒฝ๋ก
- frequency: ์ํ ์ฃผ๊ธฐ (minutes, hours, days, months ์ค ํ1)
- initialInstance: ์ฒซ๋ฒ์งธ ์ธ์คํด์ค ์์ (ํด๋น ์์ ์ด์ ์ ์์ฑ๋ ์ธ์คํด์ค๋ ๋ฌด์)
- timezone: timezone ์ ๋ณด
- doneFlag: ํ๋๋ฅผ ํตํด์ ์ฝ๋๋ค์ดํฐ๊ฐ ํด๋น ๋ฐ์ดํฐ์ ์ด ์ฒ๋ฆฌํ ์ค๋น๊ฐ ๋์๋์ง๋ฅผ ์๋ ค์ค(_SUCCESS, DIRECTORY ์ค ํ1)