データサイエンス-データとは何ですか?
データとは何ですか?
データは情報の集まりです。
データサイエンスの目的の1つは、データを構造化して、解釈可能で扱いやすいものにすることです。
データは2つのグループに分類できます。
- 構造化データ
- 非構造化データ
非構造化データ
非構造化データは整理されていません。分析のためにデータを整理する必要があります。
構造化データ
構造化データは整理されており、操作が簡単です。
データを構造化する方法は?
配列またはデータベーステーブルを使用して、データを構造化または表示できます。
配列の例:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
次の例は、Pythonで配列を作成する方法を示しています。
例
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
データサイエンスでは、非常に大きなデータセットを使用するのが一般的です。
このチュートリアルでは、データサイエンスの概念をできるだけ簡単に理解できるようにします。したがって、解釈しやすい小さなデータセットを使用します。