데이터시각화
-
데이터 시각화 ( Data_Visualization ) matplotlib_Line Plot_2Data Analysis & EDA 2022. 4. 18. 02:05
Maplotlib 중 Line Plot 을 이어서 실습 해 보자. Line Plot 축 이름 지정하기 # 사용방법 x축 이름 : plt.xlabel(x축 이름) y축 이름 : plt.ylabel(y축 이름) 그래프 제목 : plt.title(그래프 제목) a = np.arange(1, 10) b = a+5 plt.plot(a, b) plt.xlabel('a Label') plt.ylabel('b Label') plt.title('a, b Label Test') plt.show() x 축 이름에 'a Label' 을 y 축 이름에 'b Label' 을 그래프 제목에 'a, b Label Test' 를 추가 한 것을 확인할 수 있다. 그래프 사이즈 지정하기 # 사용방법 plt.figure(figsize=(가..
-
데이터 시각화 ( Data_Visualization ) matplotlib_Line Plot_1Data Analysis & EDA 2022. 4. 17. 02:36
Matplotlib 를 학습하기에 앞서 가장 간단한 그래프 부터 그려보는 연습을 해 보자. 원래 가장 쉬운것부터 시작해 재미를 붙여나가는것이 학습에 큰 도움이 된다고 생각하는 바 이다. Line Plot 가장 간단한 데이터시각화는 선을 그리는 라인 플롯 (Line Plot) 이다. 라인 플롯은 데이터가 시간, 순서 등에 따라 어떻게 변화하는지 보여주기 위해 사용한다. # 사용방법 plt.plot(x데이터, y데이터) 하나의 인자만 주어졌을때, a = np.arange(1, 10) plt.plot(a) plt.show() x 축은 0, 1, 2, 3 으로 순차적으로 자동 지정되고 인자로 받은 데이터는 x 축에 대응하는 y 값이 된다. 두개의 인자가 주어졌을때, a = np.arange(1, 10) b = ..
-
데이터 시각화 ( Data_Visualization ) matplotlib_2Data Analysis & EDA 2022. 4. 17. 01:26
지난 포스팅에 이어서 matplotlib 에 대해 학습해보자. 시각화를 해야하는 이유 데이터를 한 눈에 파악할 수 있다. 도메인 지식이 부족한 사람도 시각화된 데이터를 통해 데이터를 쉽게 이해할 수 있다. 데이터 전처리 단계에서 발생한 이슈에 대해 빠르게 파악할 수 있다. 데이터 기반의 효율적인 의사소통이 가능하다. 등... Matplotilb 란? 파이썬의 대표적인 데이터 시각화 라이브러리. 핵심적인 시각화 기법을 대다수 적용 가능하다. 라이브러리 불러오기 import pandas as pd # 판다스 라이브러리 import import numpy as np # numpy 라이브러리 import import matplotlib as mpl # matplotlib 라이브러리 import import ma..
-
데이터 시각화 ( Data_Visualization ) matplotlib카테고리 없음 2022. 4. 12. 01:58
데이터 생성 먼저 임의의 데이터프레임을 생성하겠다. import pandas as pd ex = pd.DataFrame({ "과목":['수학', '과학', '영어', '사회'], "점수":[95, 90, 25, 70] }) ex matplotlib 위 데이터를 가지고 데이터 시각화를 진행하기 앞서 먼저 matplotlib 를 불러와야 한다. import matplotlib.pyplot as plt # 경고 메시지 숨기기 import warnings 그래프를 나타내었을때 한글이 깨져 출력된다면 아래 명령어를 실행해보자 본인은 윈도우를 사용하기에 주석을 풀었고, 맥을 사용한다면 아래 명령어의 주석을 풀어서 실행하면 된다. # Window 의 한글 폰트 설정 plt.rc('font',family='Malgun..
-
데이터 시각화 (Data Visualization) 워드클라우드 기법Data Analysis & EDA 2022. 4. 12. 00:28
데이터 시각화란 너무 많은 데이터가 있을때 데이터로부터 유용한 정보를 얻기가 어렵다. 이를 해결하기 위해 데이터 시각화를 하게되면 세분화된 데이터를 쉽게 이해하며 시각적으로 설득력 있고 유용한 비즈니스 정보로 전환할 수 있다. 가장 쉬운 예로 주식 그래프를 살펴보자. 주식을 하다 보면 위와 같은 차트를 쉽게 볼 수 있다. 하지만, 초 단위로 빠르게 이루어지는 거래를 매번 숫자로 표시가 된다면 한 눈에 파악하기가 불편할 것이다. 그렇기에 우리는 조금더 빠르고 간결하게 파악하기 위해 시각화를 이용하는겁니다. 워드클라우드 워드 클라우드란 키워드, 개념 등을 직관적으로 파악할 수 있도록 핵심 단어를 시각화하는 기법이다. 직접 실습을 통해 확인을 할테지만, 보다싶이 제일 크게 확인할 수 있는 단어가 몇가지 보인다..