분류 전체보기
-
코드스테이츠 AI 부트캠프 수료코드스테이츠/AI 부트캠프 2022. 10. 20. 21:49
2022 03 월 개강반이었던 AI 부트캠프 13기가 어제 (19일) 부로 모든 과정이 마무리되었다🎉
-
원하는 행 지우기 (.drop 컬럼명)Data Analysis & EDA 2022. 4. 28. 02:46
앞선 포스팅에서 .drop 메소드를 이용해 행을 지우는 실습을 해 보았다. df1.drop(df1.index[0]) 위와 같은 형태로 인덱스 번호를 지정해 행을 삭제하는 방법을 사용했는데, 이번엔 조금 더 직관적으로 제거하고 싶은 컬럼명을 지정해 제거하는 방법에 대해 알아보도록 하자. df.head() 데이터프레임에서 .head() 메소드를 사용해 5개의 행 만을 뽑아왔다. 숫자형으로 이루어진 데이터프레임에서 문자로 이루어진 diagnosis 컬럼을 제거 해 보도록 하자. df = df.drop(['diagnosis'], axis=1) df.head() 말 그대로 .drop 메소드를 사용하는데 그 안에 컬럼명만 지정 해 주면 된다. 매개변수인 axis=1 의 의미는 컬럼(열)을 지칭하며, axis=0 은..
-
지도학습과 비지도학습이란? (Feat. 회귀, 분류)Machine Learning (ML) 2022. 4. 28. 01:40
개요 여기 코끼리 사진이 있다. 이 사진을 보고 코끼리 라고 인지한 것은 내 도메인 지식으로 사진을 판단한것이라고 볼 수 있다. 이는 색깔이 회색이고, 코가 길고, 긴 상아를 갖고있는 등의 특징을 인지하여 우리가 그동안 알게 모르게 학습된 코끼리의 모습이라고 결정지을수 있는 요인일것같다. 그렇다면, 위 예시를 머신러닝으로 빗대어 보았을때 기계는 어떻게 학습을하고 그 결과로 사람의 결과와 비슷하게 맞출 수 있을까? 에 대해 글을 작성하려한다. 지도학습 정답을 알려주며 학습시키는것. 즉, 문제와 정답이 주어진 상황에서 학습을 통해 예측 값을 도출 하는 것을 의미한다. 예를들면 컴퓨터에게 이 사진은 코끼리다 라고 직접 학습시키는 방식이다. ex) 컴퓨터에게 사전에 고양이 사진을 학습 시켜 놓고, 강아지 사진을..
-
머신러닝이란?Machine Learning (ML) 2022. 4. 28. 00:58
개요 머신러닝이란? 머신 러닝은 새로운 프로그래밍 패러다임으로 불려지고 있다. 머신 러닝의 가장 큰 목적은 실제 데이터를 바탕으로 모델을 생성하고, 입력 받은 값을 토대로 출력 값에 대해 예측하는 데에 있다. 머신러닝은 인공지능에 속하는 일부라고 인지 할 수 있다. 인간이 학습과 데이터를 프로그래밍 하는 대신, 컴퓨터에 모델을 적용시켜 데이터로 하여금 학습하고 개선하는데 목적을 두고 있다. 머신러닝은 데이터셋의 패턴과 상관관계를 찾고 분석한 결과를 토대로 최적의 의사결정과 예측을 할 수 있도록 학습시키는 것이다. 즉, 머신러닝에서 최적의 예측은 데이터가 많을수록 정확도가 증가한다 라고 할 수 있다. 위 설명들을 조금더 풀어 쓴다면, 머신러닝은 데이터를 분석한 결과를 가지고 분류하거나 그 값을 예측하는것이..
-
데이터 시각화 ( Data_Visualization ) matplotlib_Line Plot_2Data Analysis & EDA 2022. 4. 18. 02:05
Maplotlib 중 Line Plot 을 이어서 실습 해 보자. Line Plot 축 이름 지정하기 # 사용방법 x축 이름 : plt.xlabel(x축 이름) y축 이름 : plt.ylabel(y축 이름) 그래프 제목 : plt.title(그래프 제목) a = np.arange(1, 10) b = a+5 plt.plot(a, b) plt.xlabel('a Label') plt.ylabel('b Label') plt.title('a, b Label Test') plt.show() x 축 이름에 'a Label' 을 y 축 이름에 'b Label' 을 그래프 제목에 'a, b Label Test' 를 추가 한 것을 확인할 수 있다. 그래프 사이즈 지정하기 # 사용방법 plt.figure(figsize=(가..
-
데이터 시각화 ( Data_Visualization ) matplotlib_Line Plot_1Data Analysis & EDA 2022. 4. 17. 02:36
Matplotlib 를 학습하기에 앞서 가장 간단한 그래프 부터 그려보는 연습을 해 보자. 원래 가장 쉬운것부터 시작해 재미를 붙여나가는것이 학습에 큰 도움이 된다고 생각하는 바 이다. Line Plot 가장 간단한 데이터시각화는 선을 그리는 라인 플롯 (Line Plot) 이다. 라인 플롯은 데이터가 시간, 순서 등에 따라 어떻게 변화하는지 보여주기 위해 사용한다. # 사용방법 plt.plot(x데이터, y데이터) 하나의 인자만 주어졌을때, a = np.arange(1, 10) plt.plot(a) plt.show() x 축은 0, 1, 2, 3 으로 순차적으로 자동 지정되고 인자로 받은 데이터는 x 축에 대응하는 y 값이 된다. 두개의 인자가 주어졌을때, a = np.arange(1, 10) b = ..
-
데이터 시각화 ( Data_Visualization ) matplotlib_2Data Analysis & EDA 2022. 4. 17. 01:26
지난 포스팅에 이어서 matplotlib 에 대해 학습해보자. 시각화를 해야하는 이유 데이터를 한 눈에 파악할 수 있다. 도메인 지식이 부족한 사람도 시각화된 데이터를 통해 데이터를 쉽게 이해할 수 있다. 데이터 전처리 단계에서 발생한 이슈에 대해 빠르게 파악할 수 있다. 데이터 기반의 효율적인 의사소통이 가능하다. 등... Matplotilb 란? 파이썬의 대표적인 데이터 시각화 라이브러리. 핵심적인 시각화 기법을 대다수 적용 가능하다. 라이브러리 불러오기 import pandas as pd # 판다스 라이브러리 import import numpy as np # numpy 라이브러리 import import matplotlib as mpl # matplotlib 라이브러리 import import ma..
-
데이터프레임 합치기 (.merge)Data Analysis & EDA 2022. 4. 15. 02:13
데이터프레임 생성 임의의 두 데이터프레임을 생성해주겠다. df = pd.DataFrame({'Test':[1, 2, 3], 'Test1':['4', '5', '6'], 'Test2':['7', '8', '9']}) df1 = pd.DataFrame({'Test':[1, 2, 3], 'Test3':['10', '11', '12'], 'Test4':['13', '14', '15']}) 조건으로는 두 변수에 담긴 데이터프레임의 첫번째 행의 값이 같게 만들어 주었다. 데이터프레임 합치기 임의로 생성한 두개의 데이터프레임을 merge 를 이용해 합쳐보자. merge는 concat과 다르게 공통된 부분을 기반으로 합치기가 주된 용도이다. df = df.merge(df1, how = 'inner', on = 'Tes..