R散布図
散布図
プロットの章から、このplot()
関数を使用して数値を相互にプロットすることを学びました。
「散布図」は、2つの数値変数間の関係を表示するために使用されるプロットの一種であり、観測ごとに1つのドットをプロットします。
同じ長さの2つのベクトルが必要です。1つはx軸(水平)用で、もう1つはy軸(垂直)用です。
例
x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <-
c(99,86,87,88,111,103,87,94,78,77,85,86)
plot(x, y)
結果:
上記の例の観察結果は、12台の車が通過した結果を示しているはずです。
グラフを初めて見る人にとっては明確ではないかもしれないので、散布図をよりよく説明するためにヘッダーとさまざまなラベルを追加しましょう。
例
x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <-
c(99,86,87,88,111,103,87,94,78,77,85,86)
plot(x, y, main="Observation
of Cars", xlab="Car age", ylab="Car speed")
結果:
要約すると、上記の例の観察結果は、12台の車が通過した結果です。
x軸は、車の古さを示します。
y軸は、通過するときの車の速度を示します。
観察の間に何か関係はありますか?
車が新しいほど速く走れるようですが、それは偶然かもしれません。結局、登録した車は12台だけでした。
プロットを比較する
上記の例では、車の速度と年齢の間に関係があるように見えますが、別の日の観測値もプロットするとどうなりますか?散布図は私たちに何か他のことを教えてくれますか?
プロットを別のプロットと比較するには、次のpoints()
関数を使用します。
例
同じ図に2つのプロットを描きます。
# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)
# day two, the age and speed of 15 cars:
x2 <-
c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <-
c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)
plot(x1, y1,
main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red",
cex=2)
points(x2, y2, col="blue", cex=2)
結果:
注:比較の違いを確認できるようにするには、(col
パラメーターを使用して)プロットに異なる色を割り当てる必要があります。赤は1日目の値を表し、青cex
は2日目を表します。ドットのサイズを大きくするためのパラメーターも追加したことに注意してください。
観察の結論: 2つのプロットを比較することにより、どちらも同じ結論を示していると言っても過言ではありません。車が新しいほど、運転速度は速くなります。