강좌
클라우드/리눅스에 관한 강좌입니다.
프로그램 분류

파이썬기초106 : Series객체_DataFrame객체다루기_pandas

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

#---------------------------------------------------------------

# Pandas의 Series 객체

#---------------------------------------------------------------


# import pandas as pd

# import numpy as np

# sr = pd.Series( [10,20,30,40], dtype=np.int32, index=['aa', 'bb', 'cc', 'dd']) #Series객체임. 기본은 int64임. index는 인덱스이름을 지정한 것. index생략하면 숫자인덱스 이용

# sr = pd.Series( [10,200,30,40], dtype=np.int32)

# sr.index = ['aa', 'bb', 'cc', 'dd']  #Series객체 sr의 인덱스를 지정한 것임.

# print(sr)

# print( type(sr))

# print(sr[0])

# print(sr[0:3])

# print(sr['aa'])     #index를 지정해서 그 값을 출력

# print(sr['aa':'cc'])


# print(sr.sum())

# print(sr.mean())

# print(sr.median())

# print(sr.std())     #표쥰편차

# print(sr.max())

# print(sr.min())

# print(sr.idxmax())      #가장큰 값의 인덱스


# print(sr+2)     #전체값에 각각 연산함.

# print(sr>20)    #20보다 큰 값을 True로, 아니면 False로 불리언결과로 출력

# print(sr[sr>20].sum())


# print(sr.sort_values())     #결과는 오름차순으로 정렬

# print(sr.sort_index()[0:2]) #2개의 값들만 시리즈로 출력


# sr.name = "SCORE"    #출력되는 시리즈객체의 이름을 지정할 수 있음.

# print(sr)


#---------------------------------------------------------------

# Pandas의 DataFrame 객체

#---------------------------------------------------------------


# df = pd.DataFrame(  [[10,20,30],

#                      [70,80,90],

#                      [60,50,40]],

#                      index=['aa','bb','cc'],            #행이름 지정

#                      columns=['kor', 'eng', 'math']     #열이름 지정

#                     )

# print(df)       #df는 DataFrame객체임.

# print(type(df))


# print( df['kor'])       #'kor'값들만 출력

# print( df['kor'].sum()) #'kor'값들의 sum()

#

# print(df.sum())     #열별로 sum

# print(df.sum().sum())   #전체 sum

#

# print(df.describe())        

# print(df.describe().ix[0])

# print(df.describe().ix[0,'kor'])

#

# print(df.index)

# print(df.columns)

# print(df.values)        #결과는 ndarray객체

# print(type(df.values))

#

# df.to_csv("my.csv")     #my.csv 파일로 출력됨


# for idx, sr in df.iteritems():

#     print(idx, sr[0], sr[1], sr[2])


# df = pd.read_csv('crime.csv', engine='python')      #파일을 읽어옴

# print(df)



# print( df['kor'] )  #결과는 시리즈객체로 ...

# print( df['kor'].sum()) #

# print( df.ix[0])  #name이 aa인 시리즈객체로 출력


# print( df.ix[0])

# print(df.ix['aa'])


# df2 = pd.DataFrame( [[10,20,30], [70,80,90], [60,50,40]])

# print(df2)

# df2.index=['aa', 'bb', 'cc']        #인덱스지정 (행이름들)

# print(df2)

# df2.columns=['kor','eng','math']    #컬럼명지정(열이름들)

# print(df2)


# df3 = pd.DataFrame([ {'name':'aaa', 'age':20},

#                      {'name':'bbb', 'age':30},

#                      {'name':'ccc', 'age':40}

#                      ]) #데이터를 리스트+딕셔너리형태로 준 Dataframe

# print(df3)

# print(type(df3))

#

# print(df[['kor', 'math']])  #결과는 DataFrame으로 출력

# print(df.ix[1:])                #1이후의 인자들에 대한 모든 값들을 출력

# print(df.ix[1:, 'eng'])

# print(df.ix[1:, 'eng':])

# print(df.ix[0:2, 'kor':'eng'])


# # case. 3

# df =  pd.DataFrame()

# df['col1'] = [10,20,30]

# df['col2'] = [40,50,60]

# df['col3'] = [70,80,90]

# print(df)


# # case. 4

# df = pd.DataFrame(columns=['kor', 'eng', 'math'])

# print(df)

# df.at['aaa'] = [10,20,30]

# df.at['bbb'] = [40,50,60]

# df.at['ccc'] = [70,80,90]

# print(df)

관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,034 명
  • 현재 강좌수 :  35,787 개
  • 현재 접속자 :  289 명