본문 바로가기
728x90
반응형

Python4

VSCode] Titanic dataset 분석하기 - 3. 신경망 neural network neural network는 사람 뉴런의 모델링 관점에서 제공된 inputs을 기반으로 outcome을 결정하는데, weights와 activation functions을 사용하는 모델이다. 머신러닝 알고리즘과 다르게, 신경망은 problem set의 이상적인 알고리즘을 모른다는 관점에서 deep learning의 형태이다. 여러가지 다양한 시나리오를 사용할 수 있으며 분류는 그 중 하나이다. 여기서는 Keras library와 TensorFlow를 사용하여 신경망을 구성하고 타이타닉 데이터셋을 다루어보자. 1. 첫번째 step은 필요한 라이브러리를 import하고 model을 만드는 것이다. Sequential 신경망을 사용할 것이다. 순차적으로 층을 쌓은 신경망이다. from keras.models .. 2023. 4. 10.
VSCode] Titanic dataset 분석하기 - 2. 모델 훈련과 평가 dataset이 준비되었으면, model을 생성해보자. scikit-learn library를 사용해서 dataset의 전처리를 하고, classification model을 train한다. 그 다음, test data로 model의 정확성을 판단한다. 1. 모델훈련의 일반적인 첫 단계는 dataset을 training, validation data로 나누는 것이다. 모든 데이터를 train하는데 사용하면, model의 성능을 평가할 수 없다. scikit-learn library의 장점은 dataset을 training, test data로 나누는 함수를 제공하는 것이다. from sklearn.model_selection import train_test_split x_train, x_test, y_t.. 2023. 4. 7.
VSCode] Titanic dataset 분석하기 - 1. 데이터 준비 Titanic dataset은 OpenML.org에 있으며, https://hbiostat.org/data/ 의 Vanderbilt University's Department of Biostatistics으로부터 제공받았다. Titanic data는 타이타닉 승객들의 생존여부와 승객들의 나이, 티켓등급 등의 특성을 제공한다. 이 데이터를 사용하여 주어진 승객의 생존여부를 예측해는 모델을 만들어보자. 데이터 준비 1. https://hbiostat.org/data/repo/titanic3.csv 경로에서 CSV file 형태의 데이터를 다운받는다. hello_ds (https://bigexecution.tistory.com/217 참조) 폴더에 저장한다. 2. Jupyter notebook(hello.ip.. 2023. 4. 7.
VSCode] 데이터 사이언스 환경설정(Python extension, Miniconda) Visual Studio Code와 MS Python extension을 이용해 데이터 사이언스를 시작해보자. 개발환경 1. Visual Studio Code 2. Python extension for VS Code Python extension에는 Pylance와 Jupyter extensions이 포함되어 있다. 3. Miniconda with latest Python Miniconda는 conda의 minimal installer이며 무료이다. 아래 경로에서 최신 파일 다운로드 받아 설치하면 된다. conda package manager, Python, packages they depend on 등이 포함되어 있다. Miniconda를 설치하면 conda command를 사용해 packages를 설.. 2023. 4. 7.
728x90
반응형