1. email.csv.zip 파일 업로드하기

    [데이터 셋] → 데이터셋 업로드하기 선택

    (스팸 메일 예측 데이터 다운로드 - https://www.kaggle.com/datasets/balaka18/email-spam-classification-dataset-csv)

    → CSV파일을 zip 파일로 압축하여 업로드 → 데이터셋 이름과 설명 추가

스크린샷 2022-08-03 오후 3.21.16.png

스크린샷 2022-08-04 오전 10.56.55.png

  1. 전처리 하기

    [데이터 셋] → lung cancer 데이터셋 선택

    → 우측 상단 ‘전처리 하기' 선택 (도움말 참고)

    스크린샷 2022-08-04 오전 10.33.01.png

    1. 범주형 변수 변환

    스크린샷 2022-08-04 오전 10.36.02.png

    문자형 변수는 입/출력 변수로 활용하기 위해서는 범주형 변수 변환이 필요합니다.

    여기에서 Lung_Cancer은 1개의 출력 변수로 만들어야 하므로 Label encoding을 해주어야합니다.

    전처리 완료 후 우측 상단에 ‘학습 데이터로 내보내기’ 선택

    1. 학습 하기

      스크린샷 2022-08-04 오전 10.45.10.png

      입력 변수 : AGE, SMOKING, YELLOW_FINGERS, ANXIETY, PEER_PRESSURE, CHRONIC DISEASE, FATIGUE, ALLERGY, WHEEZING, ALCOHOL CONSUMING, COUGHING, SHORTNESS OF BREATH, SWALLOWING DIFFICULTY, CHEST PAIN, GENDER_LabelEncoder

      결과 변수 : LUNG_CANCER_LabelEncoder

    스크린샷 2022-08-04 오전 10.50.38.png

    원하는 모델을 선택한 후 학습을 시작할 수 있습니다.

    1. 결과 비교