missingImputer

Definition

결측값 대체를 수행하는 노드입니다. 좌측 [피처엔지니어링]에서 [missingImputer]노드를 Designer화면에 drag & drop 한 후 우측 Components 패널에서 항목별 필요정보를 입력합니다. Components 패널의 탭별 항목에서 [더보기+] 버튼을 누르면 입력가능한 전체 항목을 볼 수 있습니다.

Set

[setting], [parameter] 설정은 [워크플로우] > [생성] > [기본구성]을 참고합니다.

Property

우측 Components 패널에서 Property탭을 선택합니다.
missingImputer001

[Node Description] 작성 중인 노드명 입력

  1. col : 대상 컬럼들 선택(int, float, double 타입컬럼만 지원)
    • Suggestion : missing Value Column 자동찾기
  2. strategy : mean, median, mode, constant 중 선택
  3. missingValue : missing value 대체값(1.0을 입력 시 타겟 컬럼 값 중 1.0을 모두 missing value로 인식함)
  4. constValue : constant strategy의 경우 missing value를 대체할 데이터

Example

  1. [S3불러오기], [missingImputer] 노드를 Designer에 Drag & Drop하여 워크플로우 생성

  2. 결측값 대체를 적용할 대상 컬럼(col)을 'pageNo'로 선택 후, strategy(채울방법)를 'mean'으로 선택 후 실행 결과는 다음과 같음 -> pageNo컬럼의 결측값을 평균값으로 채움