withColumn

Definition

새로운 컬럼을 추가하거나, 한 컬럼의 값을 다른 값으로 변경할 때 사용합니다.
좌측 [데이터처리(기본)]노드 중 [withColumn]노드를 drag & drop 한 후 Property 항목을 입력합니다.

Set

[setting], [parameter] 설정은 [워크플로우] > [생성] > [기본구성]을 참고합니다.

Property

[Node Description] 작성 중인 노드명 입력
prebasic072

  1. expresstion : 인덱스컬럼을 추가하거나, 컬럼간 연산결과를 저장할 신규컬럼 추가
    • selectType : index, column, numeric, const, custom 옵션 선택(옵션별 입력 항목 상이)
      • index : 목록에서 지정한 컬럼값의 인덱스를 설정하여 신규 컬럼에 저장
      • column : 컬럼 2개를 선택하고, 컬럼 간 사칙연산 결과를 신규 컬럼에 저장
      • numeric : 컬럼 1개와 고정 값과의 사칙연산 결과를 신규 컬럼에 저장
      • const : 특정 고정 문자열 추가
      • custom : selectType에서 수행할 수 없는 커스텀 작업결과를 신규컬럼에 저장

selectType 별 옵션

  1. index 선택 시 targetColumn, newColumn 입력하도록 화면 변경되며, targetColumn에 선택한 컬럼의 index를 newColumn에 저장
    • targetColumn : 목록 중 기준 컬럼 선택
    • newColumn : 신규 컬럼 명 입력
  2. column 선택 시 col1, operator, col2, newColumn 입력하도록 화면 변경되며, col1, col2 간 사칙연산 결과를 newColumn에 저장
    • col1 : 목록 중 첫 번째 기준 컬럼 선택
    • operator : 사칙연산 (+, -, *, /) 선택
    • col2 : 목록 중 두 번째 기준 컬럼 선택
    • newColumn : 신규 컬럼 명 입력
  3. numeric 선택 시 col1, operator, col2, newColumn 입력하도록 화면 변경되며, col1, value에 입력하는 고정값 간 사칙연산 결과를 newColumn에 저장
    • col1 : 목록 중 첫 번째 기준 컬럼 선택
    • operator : 사칙연산 (+, -, *, /) 선택
    • value : 사칙연산을 위한 고정 값
    • newColumn : 신규 컬럼 명 입력
  4. const 선택 시 newColumn, constantValue, valueType 입력하도록 화면 변경되며, constantValue에 입력하는 고정 문자열 또는 숫자를 newColumn에 저장
    • newColumn : 신규 컬럼 명
    • constantValue : 고정 문자열, 숫자
    • valueType : 컬럼 데이터 타입 (String, Number)
  5. custom 선택 시 customExpr, newColumn 입력하도록 화면 변경되며, customExpr에 입력한 연산결과를 newColumn에 저장
    • customExpr : index, column, numeric, const에서 사용할 수 없는 custom 연산식 입력
    • newColumn : 신규 컬럼 명 입력

Example

[withColumn]노드의 selectType별 작업실행결과를 확인합니다.

  1. [HDFS불러오기], [withColumn] 노드를 Designer에 Drag & Drop하여 워크플로우 생성
    prebasic073
  2. [withColumn] 노드의 selectType을 index로 선택 및 Property 입력 후 snapshot 클릭
    prebasic074
  3. [withColumn] 노드의 selectType을 column으로 선택 및 Property 입력 후 snapshot 클릭
    prebasic075
  4. [withColumn] 노드의 selectType을 numeric으로 선택 및 Property 입력 후 snapshot 클릭
    prebasic076
  5. [withColumn] 노드의 selectType을 const으로 선택 및 Property 입력 후 snapshot 클릭
    prebasic077
  6. [withColumn] 노드의 selectType을 custom으로 선택 및 Property 입력 후 snapshot 클릭
    prebasic078