Python pandasで読み取ったCSVを加工するその① - やる気ないおっさんの日常

前回下記のコードでCSVを読み込みました。

df = pd.read_csv('パス/ファイル名.csv', encoding='utf-8')

下記のように文房具の名前、値段、売れた日付が記載してある

CSVでなにがいくつ売れたか集計をしてみます。

Name,Price,Date
ボールペン,150,20210514
ノート,150,20210514
のり,100,20210514
のり,120,20210514
セロハンテープ,90,20210514
ホッチキス,350,20210515
ボールペン,120,20210515
ノート,150,20210515
ノート,150,20210515
ボールペン,100,20210515
ホッチキス,450,20210515
ボールペン,120,20210515
ホッチキス,400,20210516
ノート,150,20210516
ノート,150,20210516

stationery_counts = df['Name'].value_counts()

※value_counts()で値をカウントする

print(stationery_counts)

grouped_df = df.groupby(by='Name').sum()

※df.groupby(by=列ラベル) で列ラベルで指定した列の値によってグループ化する
total_price = grouped_df['Price']
print(total_price)

結果

ノート 5
ボールペン 4
ホッチキス 3
のり 2
セロハンテープ 1

Name
のり 220
セロハンテープ 90
ノート 750
ホッチキス 1200
ボールペン 490

以上、ちゃあ少佐でした。