pandas
こんばんは。まるやくんです。今日はpandas のグループ演算機能を使ってデータフレームのデータをグループ別に集約する機能を紹介します。 必要なライをインポート 適当なデータフレームを作成 Groupby オブジェクト作成※ data1 を key1 の値をもとにグルー…
こんばんは。まるやくんです。今日はpandasのシリーズやデータフレームのプロット機能を紹介します。 必要なライをインポート 適当なシリーズオブジェクトを作成 同じ結果を得るために乱数シードを指定 シリーズのプロット機能 ※引数にタイトル、グラフサイ…
こんばんは。まるやくんです。前回に引き続きデータの前処理について紹介します。今回はデータフレーム内の値に基づいて変換する方法について紹介します。具体例として個別の売上データがあるとします。これに所属するチーム名が入った列を追加して、チーム…
こんばんは。まるやくんです。前回に引き続きデータの前処理について紹介します。今回はデータフレームの結合から重複データの判定・削除までを紹介します。 pandas のインポート ディクショナリを作成 ディクショナリからデータフレーム作成 作成したデータ…
こんばんは。まるやくんです。データの集計や分析を行う際にデータの前処理が必要になります。例えば文字列や数値が半角、全角で統一されていなかったり、データが重複していたり、そもそもデータが欠けているなどです。今回はデータが欠損している状態を想…
こんばんは。まるやくんです。 今日はデータ分析を行う上で最初に必ず行うステップとして、データの読み込みについて紹介します。日々の集計や分析業務で取り扱うデータはエクセルやcsvファイルが多いと思います。もちろん定期的に決まったデータを集計する…
こんばんは。まるやくんです。今回は様々なデータの取り込みを紹介する予定でしたが、データフレームの簡単な集計方法についてもう少し紹介します。前回はデータフレームの列ごとの集計でしたが、今回は groupbyメソッドを使ってみたいと思います。 pandasの…
こんばんは。まるやくんです。今日はpandasを使ってデータフレームの簡単な集計方法を紹介します。 pandasのインポート データフレームの作成・表示 sumメソッドで列ごとの合計を算出 meanメソッドで列ごとの平均を算出 describeメソッドで様々な統計量を一…
こんばんは。まるやくんです。今日も引き続きpandasのデータフレームを学びました。今回はデータフレームの参照、フィルタリングです。今回である程度データフレームから必要な情報にアクセス出来るようになると思います。 pandasのインポート ディクショナ…
こんばんは。まるやくんです。今日も引き続きpandasを学びました。今回はデータフレームです。前回のシリーズは1列のデータでしたがデータフレームは複数列でエクセルの表のようなデータになっています。ディクショナリのキー・バリューが複数あると考えて…
こんばんは。まるやくんです。今日からpandasを学んでいきます。pandasはデータの取り込みや変換、解析を行うためのライブラリです。DataFrame(データフレーム)というデータ構造(エクセルの表のようなデータ)を主に使用します。エクセルファイルやCSV…