본문 바로가기

머신러닝9

Kaggle 풀어보기 - Bike Sharing Demand - 4 지난 포스팅에서 코드를 분석해봤다.예측 정확도를 높이려면 "정제된 데이터" 로 "올바른 모델" 을 사용하면 되는데, 지난 포스팅에서는"주어진 데이터" 에 "Random forest" 모델을 사용하여 예측하였다.데이터를 정제하기에 앞서, 어떤 데이터가 어떻게 사용되는지 보자.우선 datetime 을 파싱하여 연, 월, 일, 시, 분, 초 요일 로 변경해준다. 1234567train["year"] = train["datetime"].dt.yeartrain["month"] = train["datetime"].dt.monthtrain["day"] = train["datetime"].dt.daytrain["hour"] = train["datetime"].dt.hourtrain["minute"] = train["d.. 2018. 4. 1.
Kaggle 풀어보기 - Bike Sharing Demand - 3 지난 시간에 이어 코드를 분석해보고자 한다. 1. 필요한 라이브러리들을 사용하겠다고 미리 알려주는 부분이다. 똑같이 따라써주자.아래 라이브러리들을 살펴보면pandas: 통계 관련된 라이브러리이다.numpy: 숫자 관련된 라이브러리이다.matplotlib: 그래프를 그릴 수 있게 해준다.seaborn: 좀 알록달록한 그래프를 그릴 수 있게 해준다.%matplotlib inline: 실행한 화면에서 바로 그래프를 볼 수 있게 해준다.warnings.filterwarnings('ignore'): warning 메세지를 무시하게 해준다.1234567891011import pandas as pdimport numpy as np import matplotlib as mplimport matplotlib.pyplot.. 2018. 3. 26.
Kaggle 풀어보기 - Bike Sharing Demand - 2 지난 포스팅에서 65줄짜리 간단한 코드를 공유했었는데, 우선 오늘은 이 코드를 제출해서 점수를 받는 방법을 공유해보고자 한다.개인적으로, 코드를 이해하는 것 못지않게, 캐글 플랫폼을 이해하고 사용하는 데에도 시간이 많이 걸려, 메모도 할 겸 블로그에 적어 공유해보고자 한다. 우선 문제 페이지로 이동하자 (https://www.kaggle.com/c/bike-sharing-demand) 아래와 같이, 메뉴 탭에서 Kernels 를 클릭하고 New Kernel 버튼을 클릭해준다. 오른쪽 Notebook 을 클릭하면 필요한 모듈들이 설치되어 코드만 입력하면 되는, 창이 뜬다. 아래 사진처럼, 화살표 부분에 지난 포스팅에 나온 코드를 입력하고, "Shift + Enter" 를 누른후에, 일정 시간이 지나 Com.. 2018. 3. 21.
Kaggle 풀어보기 - Bike Sharing Demand - 1 Bike Sharing Demand 문제 코드는 유투브 강좌 와 공개된 public kernel을 많이 참고하였다. 목차는 1. 우선 대략적인 문제 개요를 훑고 2. 보편적이고 간단한 방법을 이용하여 우선 예측/제출을 해본 후, 3. 분석과정 및 알고리즘에 대해 다뤄보고자 한다. 요리에 비유하자면, 때로는 재료나 조리법에 대한 이해부터 시작해서 도구를 사용하는 법을 배우고 음식을 만드는 것보다, 남이 만든 음식을 먹어보고, 플레이팅도 먼저 해본 쥐에 재료를 생각해보고 음식을 만드는게 더 재미있고 맛있을 때가 있기에, 우선 제출 -> 분석 의 순서로 공부해보고자 한다. 1. 문제 분석하기 Bike sharing systems are a means of renting bicycles where the pro.. 2018. 3. 17.