agg
Definition
집계함수를 수행할 때 사용합니다.
좌측 [데이터처리(기본)]에서 [agg]노드를 drag & drop 한 후 Property 항목을 입력합니다.
Set
[setting], [parameter] 설정은 [워크플로우] > [생성] > [기본구성]을 참고합니다.
Property
[Node Description] 작성 중인 노드명 입력
aggcol : 그룹핑 기준 컬럼 선택. 대상 컬럼이 여러 개일 경우 오른쪽 [+]버튼 선택
target : 집계기준 컬럼 및 집계함수 선택
집계함수 종류 max min avg count sum
Example
상품정보 데이터를 대상으로 [agg] 노드의 max, count 함수를 적용합니다.
- [HDFS불러오기], [dropna], [agg] 노드를 Designer에 Drag & Drop하여 워크플로우 생성
- 1.aggcol에 category, group 입력하고, 2.target에 max="price", count="goods-id" 선택
- [agg] 노드의 snapshot 버튼선택하여 결과확인