Rの使い方メモ その2
Rの使い方のメモです。
■ベクトルとは
Rではデータを「ベクトル」として保存しておき、「ベクトルの要素すべての和をとる」という操作を行うことで、「総和」を求めたり「標準偏差」や「分散」を求めたりすることができる。
体重データを「x」という名前の変数に読み込ませておいて
次にデータ「x」の「総和」を求める。
## 変数に入力 > x<- c(70,62,66,67,65,63,63,65,68,59) ## 総和 > sum(x) [1] 648 ## 標準偏差 > sd(x) [1] 3.190263
■「ベクトル」の作成
・関数c()をつかう。
> x<- c(70,62,66,67,65,63,63,65,68,59) ## 表示 > x ## 代入&表示 > (x<- c(70,62,66,67,65,63,63,65,68,59)) ## 1から13までの公差が1の等差数列を作る場合 > x <- 1:13
とか
seq(1,5,length=3) :長さ「3」の1から5までの「等差数列」を生成する。
seq(1,5,by=2) :1から5まで「2」ずつ増加する「等差数列」を生成する。
rep(1:5,times=3) :数列「1:5」を3個繰り返した「数列」を生成する。
rep(1:5,length=10) :数列「1:5」を数列の長さが「10」になるまで繰り返したような「数列」を生成する。
numeric(7) :「0」を7個並べた「ベクトル」を生成する。
unique(x) : ベクトル「x」中の反復した値を除いた「ベクトル」を返す。
乱数列を作る関数もある。
rbeta
rbinom
rcauchy
とか。
■ベクトルに使う関数
・数学関数
ベクトル「x」の各要素に対する「平方根」をとる。
> sqrt(x) [1] 8.366600 7.874008 8.124038 8.185353 8.062258 7.937254 7.937254 8.062258 [9] 8.246211 7.681146 ## 和 > x <- c(1,2,3,3,3,4,4,4,5,5,70) > sum(x) [1] 104 ## 平均値 > mean(x) [1] 9.454545 ## 中央値 > median(x) [1] 4 ## 最大値、最小値、範囲 > max(x) [1] 70 > min(x) [1] 1 > range(x) [1] 1 70 ##分散(普遍分散) > var(x) [1] 404.6727
分散:
データとデータの平均値との差を2乗したものをすべて足し合わせて、「データ数 - 1」で割った値。
データの平均値からの散らばり具合を表す指標で、この値が大きければデータはよく散らばっており、小さければデータが平均値の周りに集まっている。
## 標準偏差 > sd(x) [1] 20.11648
分散の平方根(ルート)を採った値。
データの平均値から散らばり具合を表す指標だが標準偏差は分散と違ってもとのデータと単位が揃っている。
■ベクトル操作
・ベクトル同士の演算
> c(1,2,3) + c(4,5,6) [1] 5 7 9 > c(1.0,2.0) * c(3.0,4.0) [1] 3 8
以上
関連する投稿:
- 2017-04-09:PythonでVARモデルからインパルス応答推定をしてみる
- 2012-02-26:Age
- 2016-07-09:Think Bayes ベイズの定理のメモ
- 2013-10-18:Rの使い方メモ
- 2017-11-14:近況と最近のこのブログのUU数の推移