스팸 메일 분류 (x) | Notion

email.csv.zip 파일 업로드하기

[데이터 셋] → 데이터셋 업로드하기 선택

(스팸 메일 예측 데이터 다운로드 - https://www.kaggle.com/datasets/balaka18/email-spam-classification-dataset-csv)

→ CSV파일을 zip 파일로 압축하여 업로드 → 데이터셋 이름과 설명 추가

스크린샷 2022-08-03 오후 3.21.16.png

스크린샷 2022-08-04 오전 10.56.55.png

전처리 하기

[데이터 셋] → lung cancer 데이터셋 선택

→ 우측 상단 ‘전처리 하기' 선택 (도움말 참고)
1. 범주형 변수 변환
문자형 변수는 입/출력 변수로 활용하기 위해서는 범주형 변수 변환이 필요합니다.

여기에서 Lung_Cancer은 1개의 출력 변수로 만들어야 하므로 Label encoding을 해주어야합니다.

전처리 완료 후 우측 상단에 ‘학습 데이터로 내보내기’ 선택
1. 학습 하기
  
  입력 변수 : AGE, SMOKING, YELLOW_FINGERS, ANXIETY, PEER_PRESSURE, CHRONIC DISEASE, FATIGUE, ALLERGY, WHEEZING, ALCOHOL CONSUMING, COUGHING, SHORTNESS OF BREATH, SWALLOWING DIFFICULTY, CHEST PAIN, GENDER_LabelEncoder
  
  결과 변수 : LUNG_CANCER_LabelEncoder
원하는 모델을 선택한 후 학습을 시작할 수 있습니다.
1. 결과 비교