データサイエンス-PythonDataFrame
パンダでデータフレームを作成する
データフレームは、データの構造化された表現です。
架空の番号で3列5行のデータフレームを定義しましょう。
例
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
例の説明
- Pandasライブラリをpdとしてインポートします
- dという名前の変数の列と行でデータを定義します
- 関数pd.DataFrame()を使用してデータフレームを作成します
- データフレームには、3列と5行が含まれます
- print()関数を使用してデータフレーム出力を出力します
pdと書きます。DataFrame()の前で、PandasライブラリからDataFrame()関数をアクティブ化することをPythonに通知します。
DataFrameの大文字のDとFに注意してください。
出力の解釈
これは出力です:
「col1」、「col2」、「col3」が列の名前であることがわかります。
0〜4の範囲の垂直方向の数値について混同しないでください。行の位置に関する情報を教えてくれます。
Pythonでは、行の番号付けはゼロから始まります。
これで、Pythonを使用して列と行をカウントできます。
df.shape [1]を使用して、列の数を見つけることができます。
例
列の数を数えます:
count_column = df.shape[1]
print(count_column)
df.shape [0]を使用して、行数を見つけることができます。
例
行数を数えます:
count_row = df.shape[0]
print(count_row)
行と列を自分で数えられないのはなぜですか?
多くの列と行を持つより大きなデータセットを扱う場合、自分でそれを数えるのは混乱します。あなたはそれを間違って数える危険があります。Pythonの組み込み関数を正しく使用すれば、カウントが正しいことを保証します。