Python
-
loc 와 iloc 의 차이 (첫 번째 행을 컬럼(column)으로 지정하기)Data Analysis & EDA 2022. 4. 11. 01:31
데이터프레임을 다루다 보면 수많은 열과 행이 존재한다. 그 중 내가 원하는 데이터만 선택하고 싶은데 어떻게 해야할까? loc 와 iloc 의 차이 정리가 잘 되어있는 자료를 찾았다. 아래 코드를 코랩을 통해 실행시켜보자. loc : label을 통해서 값을 찾는다. name_index = ['하나의 row 이름', 'row 이름의 리스트', 'row 이름의 리스트 슬라이싱', '하나의 column 이름', 'column 이름의 리스트', 'column 이름의 리스트 슬라이싱' ] shape = ['df.loc["row4"]', 'df.loc[["row4,"row5,"row3"]]', 'df.loc["row2":"row5"]', 'df.loc[:,"col1"]', 'df.loc[:,["col4","col6..
-
데이터 행 열 위치 바꾸기 (Feat.변수 선언하기)Data Analysis & EDA 2022. 4. 10. 02:03
앞선 데이터를 가지고 이어서 진행하겠다. 불러온 데이터를 보면 행과 열이 존재한다. 이를 데이터프레임 이라고 칭한다. 변수 선언하기 df = pd.read_csv(csv, encoding='cp949') read_csv 를 통해 불러온 데이터를 df 라는 변수에 담아주었다. 변수는 한 번 지정해 주면 언제든 재사용이 가능하기에 정말 편한 방법이다. 변수에 담긴 데이터를 불러오려면 df # 만 입력해주면 데이터를 확인할 수 있다. .head(5) 를 통해 0번 인덱스 부터 4번까지의 데이터를 확인할 수 있다. 인덱스는 0 부터 시작한다. df.head(5) 데이터 행 열 위치 바꾸기 위의 데이터를 보면 가로로 시도(1) 총합 공공부문 공공부문 공공부문 민간부문 . . . 으로 나열되어있는걸 행(row) 라..
-
데이터셋 불러오기 (cvs, xlsx 등)Data Analysis & EDA 2022. 4. 10. 01:39
데이터 분야를 공부한다면 제일 처음 해야하는게 데이터를 불러오는게 아닐까 생각된다. 뭐가 있어야 이래저래 갖고놀지.. 개발환경 실습에 앞서 개발환경은 구글 코랩을 사용한다. - 코랩이란? [https://colab.research.google.com] 구글에서 만든 연구용 서비스 제품이며, Jupyter를 기반으로 만들어진 웹용 서비스이다. 대체적으로 기본적인 라이브러리가 내장되어있어 사용하기 간편하다는 장점을 갖고있다. 데이터셋 불러오기 실습에 사용된 데이터는 공공데이터를 위주로 사용할것이다. 가장먼저 코랩에 내장되어있는 라이브러리인 판다스를 사용하기위해 선언을 해주어야한다. import pandas as pd 이 의미는 pandas 를 불러오는데 이를 축약하여 pd 라고 칭하겠다는 의미이다. pd.r..