dropNaCol

Definition

전체 또는 정해진 비율이상의 NA 값으로 된 컬럼을 모두 제거합니다. 좌측 [데이터처리(고급)]노드 중 [dropNaCol]노드를 drag & drop 합니다. Property 패널의 [더보기+] 버튼을 누르면 입력가능한 전체 Property 항목을 볼 수 있습니다.

Set

[setting], [parameter] 설정은 [워크플로우 생성] > [설정]을 참고합니다.

property

[Node Description] 작성 중인 노드명 입력
dropNaCol

  1. ratio : 전체데이터에서 NA가 차지하고 있는 비율을 입력
  2. col : 지정된 컬럼을 Grouping 하여 해당 그룹이 조건에 해당하면 컬럼을 모두 제거

Example

NA 값이 8% 이상 포함된 컬럼을 제거하는 워크플로우를 구성합니다.

  1. [HDFS불러오기], [dropNaCol] 노드를 Designer에 Drag & Drop하여 워크플로우 생성
    dropNaCol
  2. [dropNaCol]노드에 아래와 같이 입력 후 snapshot 클릭
    dropNaCol