agg

Definition

집계함수를 수행할 때 사용합니다.
좌측 [데이터처리(기본)]에서 [agg]노드를 drag & drop 한 후 Property 항목을 입력합니다.

Set

[setting], [parameter] 설정은 [워크플로우] > [생성] > [기본구성]을 참고합니다.

Property

[Node Description] 작성 중인 노드명 입력
prebasic001

  1. aggcol : 그룹핑 기준 컬럼 선택. 대상 컬럼이 여러 개일 경우 오른쪽 [+]버튼 선택

  2. target : 집계기준 컬럼 및 집계함수 선택

    집계함수 종류
    max
    min
    avg
    count
    sum

Example

상품정보 데이터를 대상으로 [agg] 노드의 max, count 함수를 적용합니다.

  1. [HDFS불러오기], [dropna], [agg] 노드를 Designer에 Drag & Drop하여 워크플로우 생성
    prebasic002
  2. 1.aggcol에 category, group 입력하고, 2.target에 max="price", count="goods-id" 선택
    prebasic003
  3. [agg] 노드의 snapshot 버튼선택하여 결과확인
    prebasic004