treeSelector

Definition

범주형 피처를 갖는 labeled 데이터를 결정트리 알고리즘에 기반하여 label에 대해 importance가 높은 상위 n개의 feature를 select하는 노드입니다. 좌측 [피처엔지니어링]에서 [treeSelector]노드를 Designer화면에 drag & drop 한 후 우측 Components 패널에서 항목별 필요정보를 입력합니다. Components 패널의 탭별 항목에서 [더보기+] 버튼을 누르면 입력가능한 전체 항목을 볼 수 있습니다.

Set

[setting], [parameter] 설정은 [워크플로우] > [생성] > [기본구성]을 참고합니다.

Property

우측 Components 패널에서 Property탭을 선택합니다.

treeSelector001

[Node Description] 작성 중인 노드명 입력

  1. col : 대상 컬럼 선택
  2. labelColumn : label 컬럼 명 (숫자형)
  3. numTopFeatures : tree based analysis에 따른 상위 feature의 수
  4. overwriteSchema : 실행 결과에 대한 스키마를 재정의(체크 안 할 경우 이전 스키마를 그대로 사용함)
  5. newSchema : newSchema 정의

Example

  1. [ICOS불러오기], [treeSelector] 노드를 Designer에 Drag & Drop하여 워크플로우 생성 treeSelector002

  2. treeSelector를 적용할 대상 컬럼(col)을 선, 'labelColumn'명을 입력 후 numberTopFeatures 설정 후 실행 결과는 다음과 같음 treeSelector003