IT

pandas numpy 기초 (객체/자료형/차원/연산/출력)

astrocker 2020. 12. 28. 00:17
반응형

구글 코렙에서 test 했습니다.

import pandas as pd # 데이터 처리용 라이브러리
import numpy as np  # 수치해석용 라이브러리
  • Series : 1차원 list, dict, tuple 객체
  • DataFrame : 2차원 이상 배열, 행렬 객체
  • ndarray : numpy의 n차원 배열 객체
# 1차원 Series 객체
sr=pd.Series([10,20,30,40,50],
             index=['a','b','c','d','e'],
             dtype=int,name='kor')
print(sr)
type(sr)

Result :
a    10
b    20
c    30
d    40
e    50
Name: kor, dtype: int64
pandas.core.series.Series

 

# numpy의 ndarray class, n차원 배열 객체
# 파이썬 list와 달리 같은 자료형의 배열에 데이터만 담을 수 있다.
a = np.array([0,1,2,3,4,5,6,7,8,9]) 

print('[ 넘파이 ndarray 자료형 ]')
print('자료형 :',type(a))
print('출력결과', a)

print('-'*35)

# 파이썬 기본 list class
a1=[0,1,2,3,4,5,6,7,8,9] 

print('[ 파이썬 list 자료형 ]')
print('자료형 :',type(a1))
print('출력결과', a1)

Result :
[ 넘파이 ndarray 자료형 ]
자료형 : <class 'numpy.ndarray'>
출력결과 [0 1 2 3 4 5 6 7 8 9]
-----------------------------------
[ 파이썬 list 자료형 ]
자료형 : <class 'list'>
출력결과 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

 

a2=a+a1
print(a2) # ndarry와 list 간 연산이 된다. ndarray 객체로 바뀜.
type(a2)

Result :
[ 0  2  4  6  8 10 12 14 16 18]
numpy.ndarray

 

print(sr.ndim)        # 차원 확인
print(sr.shape)       # 행열 크기 출력(row, column)
print(sr.dtype)       # 타입 확인
print(sr.name)        # 이름 확인
print(type(sr.index)) # sr 변수의 index는 list 아님.
print(sr.index)

print(type(sr))
print(type(sr.values)) # sr 변수의 값은 ndarray 객체임.
print(sr.values)       # print() 있고 없을 경우 출력 결과 차이 확인.
sr.values              # 파이썬 자체 스타일로 출력

Result :
1
(5,)
int64
kor
<class 'pandas.core.indexes.base.Index'>
Index(['a', 'b', 'c', 'd', 'e'], dtype='object')
<class 'pandas.core.series.Series'>
<class 'numpy.ndarray'>
[10 20 30 40 50]
array([10, 20, 30, 40, 50])

 

a=10
b=20

print('a =',a)
a # 출력 안 됨
b # print() 없이 출력하면 마지막 결과값만 출력, 파이썬 자체 스타일 적용

Result :
a = 10
20

 

 

 

728x90
반응형