email.csv.zip 파일 업로드하기
[데이터 셋] → 데이터셋 업로드하기 선택
(스팸 메일 예측 데이터 다운로드 - https://www.kaggle.com/datasets/balaka18/email-spam-classification-dataset-csv)
→ CSV파일을 zip 파일로 압축하여 업로드 → 데이터셋 이름과 설명 추가
전처리 하기
[데이터 셋] → lung cancer 데이터셋 선택
→ 우측 상단 ‘전처리 하기' 선택 (도움말 참고)
문자형 변수는 입/출력 변수로 활용하기 위해서는 범주형 변수 변환이 필요합니다.
여기에서 Lung_Cancer은 1개의 출력 변수로 만들어야 하므로 Label encoding을 해주어야합니다.
전처리 완료 후 우측 상단에 ‘학습 데이터로 내보내기’ 선택
학습 하기
입력 변수 : AGE, SMOKING, YELLOW_FINGERS, ANXIETY, PEER_PRESSURE, CHRONIC DISEASE, FATIGUE, ALLERGY, WHEEZING, ALCOHOL CONSUMING, COUGHING, SHORTNESS OF BREATH, SWALLOWING DIFFICULTY, CHEST PAIN, GENDER_LabelEncoder
결과 변수 : LUNG_CANCER_LabelEncoder
원하는 모델을 선택한 후 학습을 시작할 수 있습니다.