Python pandasで読み取ったCSVを加工するその①
前回下記のコードでCSVを読み込みました。
df = pd.read_csv('パス/ファイル名.csv', encoding='utf-8')
下記のように文房具の名前、値段、売れた日付が記載してある
CSVでなにがいくつ売れたか集計をしてみます。
Name,Price,Date
ボールペン,150,20210514
ノート,150,20210514
のり,100,20210514
のり,120,20210514
セロハンテープ,90,20210514
ホッチキス,350,20210515
ボールペン,120,20210515
ノート,150,20210515
ノート,150,20210515
ボールペン,100,20210515
ホッチキス,450,20210515
ボールペン,120,20210515
ホッチキス,400,20210516
ノート,150,20210516
ノート,150,20210516
stationery_counts = df['Name'].value_counts()
※value_counts()で値をカウントする
print(stationery_counts)
grouped_df = df.groupby(by='Name').sum()
※df.groupby(by=列ラベル) で列ラベルで指定した列の値によってグループ化する
total_price = grouped_df['Price']
print(total_price)
結果
ノート 5
ボールペン 4
ホッチキス 3
のり 2
セロハンテープ 1
Name
のり 220
セロハンテープ 90
ノート 750
ホッチキス 1200
ボールペン 490
以上、ちゃあ少佐でした。