現場で役立つデータ分析を学ぶ

データ分析大学

R Rの基礎

R 最初の一歩。オブジェクトを理解する。

更新日:

Rでは、数字や文字列、関数などをオブジェクトという単位で利用します。では、どのように利用するのでしょうか。具体的に見ていきます。

下記は、RStudioで記載したコードです。

# 「#」より後ろはコメントアウトを意味し、注釈などを付けることが可能です

# 100という数値を示すxというオブジェクトをつくる
x <- 100

X # 大文字を小文字を認識するためエラーとなる

x # xというオブジェクトの中身を表示する

上記の「x <- 100」という箇所で、100という数値を示すxという名前のオブジェクトを作成するという処理をしています。ここで、オブジェクトは100という数値です。今回は数値ですが文字列でも関数で何でもオブジェクトという単位になり得ます。ちなみに、「<-」は代入演算子と呼びます。

上記のコードを実行すると、コンソール画面に下記の結果が表示されます。

> # 「#」より後ろはコメントアウトを意味し、注釈などを付けることが可能です
> 
> # 100という数値を示すxというオブジェクトをつくる
> x <- 100
> 
> X # 大文字を小文字を認識するためエラーとなる
Error: object 'X' not found
> 
> x # xというオブジェクトの中身を表示する
[1] 100
> 

Rでは小文字と大文字を識別します。そのため、オブジェクト名が小文字のxであるにも関わらず、大文字のXで呼び出そうとするとエラーとなります。

次に関数についても見ていきます。Rにおける関数とは、()の要素を対象に何らかの処理をおこなうオブジェクトです。下記では、カッコ内の要素を合計する関数を例に挙げます。ちなみに、カッコ内の1:3は、1~3までの数字という意味です。

> sum(1:3) # 1~3までの数値を合計する
[1] 6
> 

下記のように、合計の結果を示すオブジェクトに名前を付けることも可能です。

> s <- sum(1:3) # 1~3までの数値を合計する
> 
> s
[1] 6

このようにRではいろんなオブジェクトがあり、それに名前を付けることができます。今回は、適当な名前を付けていますがそのオブジェクトの内容に合った名前を付けると大変分かりやすくなります。ただ、適切なオブジェクト名を付けようとすると結構悩みますね(笑)。

以下では、Rでよく使われる関数について列挙します。Rを使っていれば自然と覚えるものなので暗記する必要はないですが、どんなものがあるかだけ知っておくと後で役立つと思います。

基本関数機能
colnamesデータフレームや行列の列名を確認
rownamesデータフレームや行列の列名を確認
setwd作業フォルダを変更 例:setwd("C:/user")
getwd現在の作業フォルダを確認
ls作業フォルダのオブジェクトを確認
file.showファイルの中身を確認 例:file.show("C:/user/data.csv")
headデータの先頭6行を表示
tailデータの最後6行を表示
lengthベクトルの要素を表示
namesベクトルの名前を表示
nrowデータフレームや行列の行数を表示
ncolデータフレームや行列の列数を表示
libraryパッケージを読み込む
helpヘルプを表示 例:help(sum)又は ?sum
統計関数機能
sum合計
mean算術平均
max最大値
min最小値
range範囲(最大値-最小値)
median中央値
var普遍分散
sd標準偏差
quantile四分位点
IQR四分位範囲
summary統計要約量(最小値、第 1 四分位点、中央値、平均、第 3 四分位点、最大値が表示される)
数学関数機能
sqrt平方根
abs絶対値
round値の丸め
floor値の切り捨て
ceiling値の切り上げ
log底をeとする対数(自然対数)
log10底を10とする対数
log2底を2とする対数
log1p1を加算した結果の自然対数
exp指数関数
sin, cos, tan三角関数
asin, acos, atan三角関数の逆関数

次回はオブジェクトのタイプについて理解しましょう。

-R, Rの基礎

Copyright© データ分析大学 , 2020 All Rights Reserved Powered by STINGER.