본문 바로가기
IT

pandas 란? pandas 라이브러리

by seohmoon 2022. 8. 30.

pandas

python에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있음

장점

  • 대용량의 데이터들을 보다 안정적으로 처리 가능함
  • 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조
  • 누락된 데이터를 유연하게 처리할 수 있는 기능
import pandas as pd

Pandas 자료구조

Pandas에서는 기본적으로 정의되는 자료구조인 1차원 배열 형태의 Series와 2차원 배열 형태의 Data Frame을 사용합니다. 이 자료구조들은 빅 데이터 분석에 있어서 높은 수준의 성능을 보여줍니다.

Series

  • 시트의 열 1개를 의미
  • 1차원 배열 형태의 데이터 구조를 사용
  • 가로 방향으로 크기 변경
  • 색인 추가 가능

Data Frame

  • 엑셀에서 볼 수 있는 시트(Sheet)와 동일한 개념
  • 2차원 배열 형태의 데이터 구조로 행과 열이 있음
  • 행을 구분해주는 인덱스(index)와 열을 구분해주는 컬럼(column

'IT' 카테고리의 다른 글

folium 라이브러리  (0) 2022.08.30
Matplotlib 란? NumPy 라이브러리  (0) 2022.08.30
OAuth  (0) 2022.08.01
URI vs URL vs URN 비교 및 특징 정리  (0) 2022.07.28
[git] 깃 브랜치 사용법 / git branch 생성 변경 삭제  (0) 2022.07.25

댓글