まるやくんのブログ

使ってみて便利だと思ったモノやサービス、仕事やプライベートで学んでいる事を紹介します。

Python pandas Groupby による集計

こんばんは。まるやくんです。今日はpandas のグループ演算機能を使ってデータフレームのデータをグループ別に集約する機能を紹介します。

  1. 必要なライをインポート
  2. 適当なデータフレームを作成
  3. Groupby オブジェクト作成
    ※ data1 を key1 の値をもとにグループ分けされる
  4. ke1 の値(A, B, C, D)毎に平均値を算出
  5. ke1 の値(A, B, C, D)毎に合計値を算出
  6. データフレームの各列に対して key2 の平均値を算出

データ集計の際に例えば担当者別、チーム別、業務別にデータを集計したいことはよくあるのでこの機能があると非常に便利だと思いました。