본문 바로가기

머신러닝9

모두의 인공지능 with 파이썬 (누구나 쉽게 시작하는 딥러닝 기초 프로그래밍) 리뷰 인공지능을 공부하면서 수식과 코드가 잔뜩 있는 책에 압박을 많이 받았었다. 조금 쉽게 이해할 수 있는 책을 찾게 되었고, 친절한 설명과 표지에 표제의 책을 읽어보게 되었다. 이 책은 크게 두 가지 부분으로 나뉘어지는데, 딥러닝에 대한 대략적인 이해와 설명을 알려주는 부분 (첫째 마당, 둘째 마당) 과 실제로 파이썬으로 예제를 따라하는 (셋째 마당, 넷째 마당) 부분으로 나누어진다. 기본적인 내용을 알기 쉽게 설명해줘서 어렵지 않게 따라갈 수 있었다. 장마다 풍부하게 삽입된 그림과 예시 사진들도 이해하는데 도움이 되었다. 앞에 설명이 너무 쉽게 쉽게 되어 있어 깊이가 너무 없는 책일까 걱정이 되기도 했지만, 뒤로 갈수록 점점 많은 내용을 다루게 된다. 일례로, 앞부분에는 간단한 툴을 이용해 손가락 인식 예.. 2021. 6. 15.
Kaggle 풀어보기 - DonorsChoose -3 이번 포스팅에서는 준비한 데이터를 모델에 넣어 예측해보자scikit learn 을 import 하고 scaling 을 해준다.scaling 은 "스케일링은 자료 집합에 적용되는 전처리 과정으로 모든 자료에 선형 변환을 적용하여 전체 자료의 분포를 평균 0, 분산 1이 되도록 만드는 과정" 이라고 한다.fit_transform 메서드를 이용해서 train_non_cat 와 test_non_cat 을 변환시켜준다1234from sklearn.preprocessing import StandardScalerstd = StandardScaler()train_non_cat_scaled = pd.DataFrame(std.fit_transform(train_non_cat),columns=train_non_cat.col.. 2018. 4. 15.
Kaggle 풀어보기 - DonorsChoose - 2 이어서 DonorsChoose 문제를 계속 풀어보자지난번, project_essay_1 과 3, project_essary_2 와 4를 각각 합쳤으므로,필요 없는 column 들을 제거해주자.123columns_to_remove = ["id","project_essay_1","project_essay_2","project_essay_3","project_essay_4"]train_joined.drop(columns_to_remove,inplace=True,axis=1)test_joined.drop(columns_to_remove,inplace=True,axis=1)Colored by Color Scriptercs그리고 모델에 넣기 전, 데이터들을 분류해준다.카테고리 중 선택이 가능한 categorical.. 2018. 4. 14.
Kaggle 풀어보기 - DonorsChoose - 1 이번에는 Donors Choose 라는 문제를 풀어보자.기부금 지원을 요청하는 수십만 건의 프로젝트 중에서 프로젝트와 교사, 학교에 대한 정보를 이용하여프로젝트가 승인될지 여부를 예측하는 문제이다.우선 필요한 라이브러리를 import 하고, 데이터들을 읽어온다.1234567import numpy as np import pandas as pd train = pd.read_csv("../input/train.csv")test = pd.read_csv("../input/test.csv")train_resource = pd.read_csv("../input/resources.csv")cstrain_resource 는 아래와 같이 생긴 데이터이다. id description quantity price 0 p233.. 2018. 4. 13.