파이썬기초106 : Series객체_DataFrame객체다루기_pandas
작성자 정보
- 관리자 작성
- 작성일
컨텐츠 정보
- 2,895 조회
- 0 추천
- 목록
본문
#---------------------------------------------------------------
# Pandas의 Series 객체
#---------------------------------------------------------------
# import pandas as pd
# import numpy as np
# sr = pd.Series( [10,20,30,40], dtype=np.int32, index=['aa', 'bb', 'cc', 'dd']) #Series객체임. 기본은 int64임. index는 인덱스이름을 지정한 것. index생략하면 숫자인덱스 이용
# sr = pd.Series( [10,200,30,40], dtype=np.int32)
# sr.index = ['aa', 'bb', 'cc', 'dd'] #Series객체 sr의 인덱스를 지정한 것임.
# print(sr)
# print( type(sr))
# print(sr[0])
# print(sr[0:3])
# print(sr['aa']) #index를 지정해서 그 값을 출력
# print(sr['aa':'cc'])
# print(sr.sum())
# print(sr.mean())
# print(sr.median())
# print(sr.std()) #표쥰편차
# print(sr.max())
# print(sr.min())
# print(sr.idxmax()) #가장큰 값의 인덱스
# print(sr+2) #전체값에 각각 연산함.
# print(sr>20) #20보다 큰 값을 True로, 아니면 False로 불리언결과로 출력
# print(sr[sr>20].sum())
# print(sr.sort_values()) #결과는 오름차순으로 정렬
# print(sr.sort_index()[0:2]) #2개의 값들만 시리즈로 출력
# sr.name = "SCORE" #출력되는 시리즈객체의 이름을 지정할 수 있음.
# print(sr)
#---------------------------------------------------------------
# Pandas의 DataFrame 객체
#---------------------------------------------------------------
# df = pd.DataFrame( [[10,20,30],
# [70,80,90],
# [60,50,40]],
# index=['aa','bb','cc'], #행이름 지정
# columns=['kor', 'eng', 'math'] #열이름 지정
# )
# print(df) #df는 DataFrame객체임.
# print(type(df))
# print( df['kor']) #'kor'값들만 출력
# print( df['kor'].sum()) #'kor'값들의 sum()
#
# print(df.sum()) #열별로 sum
# print(df.sum().sum()) #전체 sum
#
# print(df.describe())
# print(df.describe().ix[0])
# print(df.describe().ix[0,'kor'])
#
# print(df.index)
# print(df.columns)
# print(df.values) #결과는 ndarray객체
# print(type(df.values))
#
# df.to_csv("my.csv") #my.csv 파일로 출력됨
# for idx, sr in df.iteritems():
# print(idx, sr[0], sr[1], sr[2])
# df = pd.read_csv('crime.csv', engine='python') #파일을 읽어옴
# print(df)
# print( df['kor'] ) #결과는 시리즈객체로 ...
# print( df['kor'].sum()) #
# print( df.ix[0]) #name이 aa인 시리즈객체로 출력
# print( df.ix[0])
# print(df.ix['aa'])
# df2 = pd.DataFrame( [[10,20,30], [70,80,90], [60,50,40]])
# print(df2)
# df2.index=['aa', 'bb', 'cc'] #인덱스지정 (행이름들)
# print(df2)
# df2.columns=['kor','eng','math'] #컬럼명지정(열이름들)
# print(df2)
# df3 = pd.DataFrame([ {'name':'aaa', 'age':20},
# {'name':'bbb', 'age':30},
# {'name':'ccc', 'age':40}
# ]) #데이터를 리스트+딕셔너리형태로 준 Dataframe
# print(df3)
# print(type(df3))
#
# print(df[['kor', 'math']]) #결과는 DataFrame으로 출력
# print(df.ix[1:]) #1이후의 인자들에 대한 모든 값들을 출력
# print(df.ix[1:, 'eng'])
# print(df.ix[1:, 'eng':])
# print(df.ix[0:2, 'kor':'eng'])
# # case. 3
# df = pd.DataFrame()
# df['col1'] = [10,20,30]
# df['col2'] = [40,50,60]
# df['col3'] = [70,80,90]
# print(df)
# # case. 4
# df = pd.DataFrame(columns=['kor', 'eng', 'math'])
# print(df)
# df.at['aaa'] = [10,20,30]
# df.at['bbb'] = [40,50,60]
# df.at['ccc'] = [70,80,90]
# print(df)
관련자료
-
이전
-
다음