stringIndexer

Definition

문자열 데이터를 숫자로 변환하는 노드입니다. 좌측 [피처엔지니어링]에서 [stringIndexer]노드를 Designer화면에 drag & drop 한 후 우측 Components 패널에서 항목별 필요정보를 입력합니다. Components 패널의 탭별 항목에서 [더보기+] 버튼을 누르면 입력가능한 전체 항목을 볼 수 있습니다.

Set

[setting], [parameter] 설정은 [워크플로우] > [생성] > [기본구성]을 참고합니다.

Property

우측 Components 패널에서 Property탭을 선택합니다.

stringIndexer001

[Node Description] 작성 중인 노드명 입력

  1. column : 변경할 컬럼을 선택하고 새로운 컬럼 명을 입력
    • target Column : 대상 컬럼 선택(String 타입 컬럼만 지원)
    • new Column : 결과 컬럼 명 입력
    • stringOrderType : 정렬 방식 선택
      • frequencyDesc : 빈도수 내림차순
      • frequencyAsc : 빈도수 오름차순
      • alphabetDesc : 알파벳 내림차순
      • alphabetAsc : 알파벳 오름차순
    • handleInvalid : 비정상 데이터 처리방식
      • error
      • skip
      • keep

Example

  1. [ICOS불러오기], [stringIndexer] 노드를 Designer에 Drag & Drop하여 워크플로우 생성

  2. stringIndexer를 적용할 대상 컬럼(col)을 'group'로 선택, new Column을 'numeric_group'으로 설정, stringOrderType을 'frequencyDesc', handleInvalid를 'skip'으로 설정 후 실행 결과는 다음과 같음 -> group (스트링타입데이터) 를 numeric_group(숫자형데이터)열로 변환하여 추가