データサイエンス-PythonDataFrame


パンダでデータフレームを作成する

データフレームは、データの構造化された表現です。

架空の番号で3列5行のデータフレームを定義しましょう。

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

例の説明

  • Pandasライブラリをpdとしてインポートします
  • dという名前の変数の列と行でデータを定義します
  • 関数pd.DataFrame()を使用してデータフレームを作成します
  • データフレームには、3列と5行が含まれます
  • print()関数を使用してデータフレーム出力を出力します

pdと書きます。DataFrame()の前で、PandasライブラリからDataFrame()関数をアクティブ化することをPythonに通知します。

DataFrameの大文字のDとFに注意してください。


出力の解釈

これは出力です:

データフレーム出力

「col1」、「col2」、「col3」が列の名前であることがわかります。

0〜4の範囲の垂直方向の数値について混同しないでください。行の位置に関する情報を教えてくれます。

Pythonでは、行の番号付けはゼロから始まります。

これで、Pythonを使用して列と行をカウントできます。

df.shape [1]を使用して、列の数を見つけることができます。

列の数を数えます:

count_column = df.shape[1]
print(count_column)

df.shape [0]を使用して、行数を見つけることができます。

行数を数えます:

count_row = df.shape[0]
print(count_row)

行と列を自分で数えられないのはなぜですか?

多くの列と行を持つより大きなデータセットを扱う場合、自分でそれを数えるのは混乱します。あなたはそれを間違って数える危険があります。Pythonの組み込み関数を正しく使用すれば、カウントが正しいことを保証します。