프로그램

파이썬기초106 : Series객체_DataFrame객체다루기_pandas

관리자 작성
작성일 2023.02.10 11:24

6,155 조회
0 추천
목록

#---------------------------------------------------------------

# Pandas의 Series 객체

#---------------------------------------------------------------

# import pandas as pd

# import numpy as np

# sr = pd.Series( [10,20,30,40], dtype=np.int32, index=['aa', 'bb', 'cc', 'dd']) #Series객체임. 기본은 int64임. index는 인덱스이름을 지정한 것. index생략하면 숫자인덱스 이용

# sr = pd.Series( [10,200,30,40], dtype=np.int32)

# sr.index = ['aa', 'bb', 'cc', 'dd'] #Series객체 sr의 인덱스를 지정한 것임.

# print(sr)

# print( type(sr))

# print(sr[0])

# print(sr[0:3])

# print(sr['aa']) #index를 지정해서 그 값을 출력

# print(sr['aa':'cc'])

# print(sr.sum())

# print(sr.mean())

# print(sr.median())

# print(sr.std()) #표쥰편차

# print(sr.max())

# print(sr.min())

# print(sr.idxmax()) #가장큰 값의 인덱스

# print(sr+2) #전체값에 각각 연산함.

# print(sr>20) #20보다 큰 값을 True로, 아니면 False로 불리언결과로 출력

# print(sr[sr>20].sum())

# print(sr.sort_values()) #결과는 오름차순으로 정렬

# print(sr.sort_index()[0:2]) #2개의 값들만 시리즈로 출력

# sr.name = "SCORE" #출력되는 시리즈객체의 이름을 지정할 수 있음.

# print(sr)

#---------------------------------------------------------------

# Pandas의 DataFrame 객체

#---------------------------------------------------------------

# df = pd.DataFrame( [[10,20,30],

# [70,80,90],

# [60,50,40]],

# index=['aa','bb','cc'], #행이름 지정

# columns=['kor', 'eng', 'math'] #열이름 지정

# )

# print(df) #df는 DataFrame객체임.

# print(type(df))

# print( df['kor']) #'kor'값들만 출력

# print( df['kor'].sum()) #'kor'값들의 sum()

# print(df.sum()) #열별로 sum

# print(df.sum().sum()) #전체 sum

# print(df.describe())

# print(df.describe().ix[0])

# print(df.describe().ix[0,'kor'])

# print(df.index)

# print(df.columns)

# print(df.values) #결과는 ndarray객체

# print(type(df.values))

# df.to_csv("my.csv") #my.csv 파일로 출력됨

# for idx, sr in df.iteritems():

# print(idx, sr[0], sr[1], sr[2])

# df = pd.read_csv('crime.csv', engine='python') #파일을 읽어옴

# print(df)

# print( df['kor'] ) #결과는 시리즈객체로 ...

# print( df['kor'].sum()) #

# print( df.ix[0]) #name이 aa인 시리즈객체로 출력

# print( df.ix[0])

# print(df.ix['aa'])

# df2 = pd.DataFrame( [[10,20,30], [70,80,90], [60,50,40]])

# print(df2)

# df2.index=['aa', 'bb', 'cc'] #인덱스지정 (행이름들)

# print(df2)

# df2.columns=['kor','eng','math'] #컬럼명지정(열이름들)

# print(df2)

# df3 = pd.DataFrame([ {'name':'aaa', 'age':20},

# {'name':'bbb', 'age':30},

# {'name':'ccc', 'age':40}

# ]) #데이터를 리스트+딕셔너리형태로 준 Dataframe

# print(df3)

# print(type(df3))

# print(df[['kor', 'math']]) #결과는 DataFrame으로 출력

# print(df.ix[1:]) #1이후의 인자들에 대한 모든 값들을 출력

# print(df.ix[1:, 'eng'])

# print(df.ix[1:, 'eng':])

# print(df.ix[0:2, 'kor':'eng'])

# # case. 3

# df = pd.DataFrame()

# df['col1'] = [10,20,30]

# df['col2'] = [40,50,60]

# df['col3'] = [70,80,90]

# print(df)

# # case. 4

# df = pd.DataFrame(columns=['kor', 'eng', 'math'])

# print(df)

# df.at['aaa'] = [10,20,30]

# df.at['bbb'] = [40,50,60]

# df.at['ccc'] = [70,80,90]

# print(df)

이전

파이썬기초107 : 데이터분석과시각화_기초1_numpy

작성일 2023.02.10 11:25
다음

리눅스마스터2급강좌 : 메모리 사용량 확인하기(free)

작성일 2023.02.10 11:21

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

메뉴
검색
클라우드포털

파이썬기초106 : Series객체_DataFrame객체다루기_pandas

공지사항

뉴스광장

작성자 정보

컨텐츠 정보

본문

관련자료

공지사항

뉴스광장