データサイエンス-データとは何ですか?


データとは何ですか?

データは情報の集まりです。

データサイエンスの目的の1つは、データを構造化して、解釈可能で扱いやすいものにすることです。

データは2つのグループに分類できます。

  • 構造化データ
  • 非構造化データ

非構造化データ

非構造化データは整理されていません。分析のためにデータを整理する必要があります。

非構造化データ

非構造化データ


構造化データ

構造化データは整理されており、操作が簡単です。

構造化データ


データを構造化する方法は?

配列またはデータベーステーブルを使用して、データを構造化または表示できます。

配列の例:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

次の例は、Pythonで配列を作成する方法を示しています。

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

データサイエンスでは、非常に大きなデータセットを使用するのが一般的です。

このチュートリアルでは、データサイエンスの概念をできるだけ簡単に理解できるようにします。したがって、解釈しやすい小さなデータセットを使用します。