まるやくんのブログ

使ってみて便利だと思ったモノやサービス、仕事やプライベートで学んでいる事を紹介します。

pandas

Python pandas Groupby による集計

こんばんは。まるやくんです。今日はpandas のグループ演算機能を使ってデータフレームのデータをグループ別に集約する機能を紹介します。 必要なライをインポート 適当なデータフレームを作成 Groupby オブジェクト作成※ data1 を key1 の値をもとにグルー…

Python pandas シリーズ・データフレームのプロット機能

こんばんは。まるやくんです。今日はpandasのシリーズやデータフレームのプロット機能を紹介します。 必要なライをインポート 適当なシリーズオブジェクトを作成 同じ結果を得るために乱数シードを指定 シリーズのプロット機能 ※引数にタイトル、グラフサイ…

Python pandas マッピングによるデータ変換

こんばんは。まるやくんです。前回に引き続きデータの前処理について紹介します。今回はデータフレーム内の値に基づいて変換する方法について紹介します。具体例として個別の売上データがあるとします。これに所属するチーム名が入った列を追加して、チーム…

Python pandas データフレームの重複削除

こんばんは。まるやくんです。前回に引き続きデータの前処理について紹介します。今回はデータフレームの結合から重複データの判定・削除までを紹介します。 pandas のインポート ディクショナリを作成 ディクショナリからデータフレーム作成 作成したデータ…

Python pandas 欠損値の穴埋め

Python pandas 欠損値の除去

こんばんは。まるやくんです。データの集計や分析を行う際にデータの前処理が必要になります。例えば文字列や数値が半角、全角で統一されていなかったり、データが重複していたり、そもそもデータが欠けているなどです。今回はデータが欠損している状態を想…

Python pandas エクセルファイルの読み込みと書き出し

こんばんは。まるやくんです。 今日はデータ分析を行う上で最初に必ず行うステップとして、データの読み込みについて紹介します。日々の集計や分析業務で取り扱うデータはエクセルやcsvファイルが多いと思います。もちろん定期的に決まったデータを集計する…

Python pandas 集計2

こんばんは。まるやくんです。今回は様々なデータの取り込みを紹介する予定でしたが、データフレームの簡単な集計方法についてもう少し紹介します。前回はデータフレームの列ごとの集計でしたが、今回は groupbyメソッドを使ってみたいと思います。 pandasの…

Python pandas 集計1

こんばんは。まるやくんです。今日はpandasを使ってデータフレームの簡単な集計方法を紹介します。 pandasのインポート データフレームの作成・表示 sumメソッドで列ごとの合計を算出 meanメソッドで列ごとの平均を算出 describeメソッドで様々な統計量を一…

Python pandas データフレームの参照、フィルタリング

こんばんは。まるやくんです。今日も引き続きpandasのデータフレームを学びました。今回はデータフレームの参照、フィルタリングです。今回である程度データフレームから必要な情報にアクセス出来るようになると思います。 pandasのインポート ディクショナ…

Python Pandas データフレーム

こんばんは。まるやくんです。今日も引き続きpandasを学びました。今回はデータフレームです。前回のシリーズは1列のデータでしたがデータフレームは複数列でエクセルの表のようなデータになっています。ディクショナリのキー・バリューが複数あると考えて…

Python pandas シリーズ

こんばんは。まるやくんです。今日からpandasを学んでいきます。pandasはデータの取り込みや変換、解析を行うためのライブラリです。DataFrame(データフレーム)というデータ構造(エクセルの表のようなデータ)を主に使用します。エクセルファイルやCSV…