Workflow

뉴럴 스튜디오의 분석 과정은 크게 1. 데이터셋 업로드, 2. 전처리 과정, 3. 학습하기, 4. 학습 결과 확인 으로 나뉩니다. 앞의 네가지 과정은 뉴럴 스튜디오 데이터분석에서 필수적으로 필요한 과정이며, 이 외에도 뉴럴 스튜디오는 데이터 핸들링, 모델 배포 등 다양한 기능들을 제공하고 있습니다.

  1. 데이터셋 업로드 → 2. 전처리 하기 → 3. 학습하기 → 4. 학습 결과 확인

스크린샷 2022-08-10 오후 1.41.36.png

  1. 데이터 셋 업로드 하기

https://neuralworks.notion.site/fedbb63ee3d342448ebbcfe1b7ee244e

데이터를 분석하기 위해서 가장 먼저 해야할 작업은 데이터를 업로드 하는 과정입니다. 뉴럴 스튜디오는 csv, 이미지 데이터셋을 업로드 할 수 있으며, 모든 분석을 하기위해서는 데이터가 필수적으로 필요합니다.

데이터 핸들링

https://neuralworks.notion.site/836f2a1abdf546d6a9185f7818d67738

데이터를 업로드 한 후에는 데이터셋의 데이터 형식을 바꾸거나 (ex- 실수형을 정수형으로), 데이터 핸들링을 통해 데이터를 분석하고 병합하는 등의 여러가지 과정을 거칠 수 있습니다. 이는 모든 데이터셋에 필수적인 단계들은 아니지만 특정 데이터셋에서는 필요한 과정이 될 수 있습니다.

  1. 전처리 하기

https://neuralworks.notion.site/46b483e97bbb40d48027037817b1c66d

원천데이터의 분석과 검토가 끝났다면 이제 데이터 분석에서 가장 중요하다고도 볼 수 있는 전처리 과정을 거쳐야합니다. 데이터셋을 있는 그대로 사용하여 분석하는 데에는 어려움이 생길 수 있으므로 분석을 위해 데이터들을 가공하는 과정입니다. 전처리가 매우 중요한 이유는 이 과정에서의 실수로 인해 데이터에 대한 학습이 아예 불가하거나(입/출력 변수를 문자형에서 실수 or 정수형으로 변환해 주지 않은 경우), 학습한 결과치가 달라질 수도 있기 때문입니다. 하지만 반대로 이 과정을 몇 번 거치고 익숙해지다보면 다양한 형식의 데이터들을 보다 정확하게 분석할 수 있다는 장점도 있습니다. 상황에 따라 전처리가 필요하지 않은 경우에는 전처리 과정에서 설정없이 학습데이터로 내보내는 것도 가능합니다. 전처리 과정에 관한 자세한 설명은 해당 링크를 참고해주시기 바랍니다.