pandas
python에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있음
장점
- 대용량의 데이터들을 보다 안정적으로 처리 가능함
- 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조
- 누락된 데이터를 유연하게 처리할 수 있는 기능
import pandas as pd
Pandas 자료구조
Pandas에서는 기본적으로 정의되는 자료구조인 1차원 배열 형태의 Series와 2차원 배열 형태의 Data Frame을 사용합니다. 이 자료구조들은 빅 데이터 분석에 있어서 높은 수준의 성능을 보여줍니다.
Series
- 시트의 열 1개를 의미
- 1차원 배열 형태의 데이터 구조를 사용
- 가로 방향으로 크기 변경
- 색인 추가 가능
Data Frame
- 엑셀에서 볼 수 있는 시트(Sheet)와 동일한 개념
- 2차원 배열 형태의 데이터 구조로 행과 열이 있음
- 행을 구분해주는 인덱스(index)와 열을 구분해주는 컬럼(column
'IT' 카테고리의 다른 글
folium 라이브러리 (0) | 2022.08.30 |
---|---|
Matplotlib 란? NumPy 라이브러리 (0) | 2022.08.30 |
OAuth (0) | 2022.08.01 |
URI vs URL vs URN 비교 및 특징 정리 (0) | 2022.07.28 |
[git] 깃 브랜치 사용법 / git branch 생성 변경 삭제 (0) | 2022.07.25 |
댓글