My practice
-
[DGU_탐색적자료분석] 지하철 승하차 인구 분석 및 보조 배터리 대여 서비스 장소 선정My practice 2021. 12. 25. 00:00
2020년 탐색적자료분석 기말고사 프로젝트 정리 1. 데이터 수집 및 가공 2. 군집분석 3. 모델링 4. 결과 분석 1. 데이터 수집 및 가공 선행 연구 분석과, 현실적으로 수집할 수 있는 자료의 타협 내에서 자료를 수집하여 분석에 활용함. (가) 2015-2019 서울교통공사 일별 역별 시간대별 승하차 인원(1~8호선 지하철) 서울 열린데이터 광장 제공; 지하철 역의 승하차 인원을 분석하는 데에 있어서 종속변수가 되는 중요한 변수이다. 역명 표기가 제각각인 경우가 많아 수작업으로 고치거나, 지하철역 코드를 활용해서 일괄적으로 통일되도록 수정하였음. 이하의 자료들을 2019년에 한하여 수집하였으므로 2019년의 승하차 인원 수만 사용 (나) 지역 거주 및 근로 인구수, 지역 연령대 통계 공공데이터포털 ..
-
[Dacon_운동동작분류] 1D CNN을 이용한 예측 모델 만들기 (private 11th, 수상)My practice 2021. 2. 27. 00:00
dacon.io/competitions/official/235689/codeshare/2385?page=3&dtype=recent&ptype=pub 운동 동작 분류 AI 경진대회 출처 : DACON - Data Science Competition dacon.io 말이 11등이지 점수 차이는 어마어마하다. colab : 드라이브 마운트 In [ ]: from google.colab import drive drive.mount('/content/drive') In [ ]: import tensorflow as tf from keras import optimizers from keras.models import Sequential from keras.layers import Dense, LSTM, BatchN..
-
[Kaggle_titanic] R의 Naive Bayes로 생존자 분류해보기My practice 2021. 1. 19. 00:00
library(dplyr) library(ggplot2) library(e1071) library(caret) library(Biocomb) library(FSelector) test=read.csv('test.csv') train=read.csv('train.csv') head(train) head(test) #Pclass(티켓등급), Sibsp(형제자매배우자), Parch(부모님) #Fare(여객운임), Cabin(객실번호), Embarked(승선항) #Name, Ticket는 제외 : 과연 의미가 있을까? #Cabin 제외 : 결측 너무 많음 train=select(train,-c("Name","Ticket","Cabin")) test=select(test,-c("Name","Ticket","Cab..