Skip to Main Content

R:ゼロから始める解析生活: 解析ノートづくり

フリーソフトRを用いたデータ解析のはじめ方を紹介。

Rで解析ノートづくり

R で解析した結果(図や統計的検定の結果)はどのように保存すればよいのか…。
R を使用していると、保存先の問題によく直面します。

R に慣れるまでは、
・コードは R のスクリプトファイル(ファイルの拡張子が .R となっているもの)に保存
・図や統計的検定の結果は Power Point のスライドにコピー & ペーストで貼り付け
が良いと思います。

しかし、データ解析をしていると、作図や統計的検定の後に解析対象のデータに不具合があることに気づくことが多々あります。この場合には元のデータを取り換えて、作図や統計的検定をやり直す必要があるため、データの取り換えの度に Power Point へのコピー&ペーストを行うことになり、とても労力がかかってしまいます。

このような時に役立つのが、R Markdown です。ここでは、R Markdown を用いた解析ノートづくりについて、簡単に紹介します。

目次

はじめに
画面の見方
基礎知識
データ読み込み
データ整理
作図
解析ノートづくり

(1) R Studio
(2) R Markdown 概要
(3) Rmdファイルの編集
おわりに

(1)R Studio

R Markdown を使うためには、R Studio をインストールしておく必要があります。

R Studio は R の統合開発環境(Integrated Development Environment, 略してIDE)
と呼ばれるもので、R を使いやすい環境を提供するソフトウェアです。
一部の機能は有料ですが、基本的には無料で使用できます。

なお、R Studio はあくまでも R を使う環境を提供するものなので、
実際に解析を行っているのは R です*。パソコン上に複数のバージョンの R を保存しておき、
R Studio を使って使用する R のバージョンを切り替えることも可能です**。

 

R Studio は以下のページからダウンロード可能です。
https://rstudio.com/products/rstudio/
(Open Source Edition がフリーのものです。)


*  R Studio を使った場合には、R と R Studio の両方を引用する必要があります。
** R Studio と R のバージョンは必ず一致するわけではないため、
 論文等では両方のバージョンを明記しておく方が望ましいです。


なお、R と R Studio の画面の違いは以下の通りです。

 

(2)R Markdown 概要

R Markdown とは、プログラムのコード、計算結果、説明文等を1つのファイルに
まとめたものです。
通常、R ではコードをスクリプトに書き、その計算結果やそれに関する説明文は
Power Point や Word 等の別ファイルに書き込む必要があります。
しかし、R Markdown を使えばそれらを1つのファイルにまとめることができます。

R Markdown では実験データに変更があったとしても、
読み込ませるデータのコードのみを書き換えるだけで
すぐに再解析の結果を出力することができます。

また、計算結果とコードをまとめられるため、計算結果がどのようにして
得られたのかを後から確認しやすく、再現性のある解析ノートづくり が可能です。

 

R Markdown では markdown 記法と呼ばれる書き方で記入します。
文字だけでなく、数式や画像、リンクなども埋め込むことができます。


上記の説明だけではあまりピンとこないかもしれません。
R Markdown がどのようなものか、実際に見てみましょう。
親切なことに、サンプルが用意されています。

R Studio の画面左上にある
  のマークをクリックして、
「R Markdown」の文字をクリックしてみてください。
すると、以下の設定画面が登場します。

 

ここでは
・Title(出力されるファイルのタイトル。ファイル名と異なってもよい。)
・Author(著者名)
・Output format(出力形式。HTML以外に PDF や Wordファイルとしても出力可。)
などを設定できます。

今回はサンプルの確認なので、そのまま「OK」をクリックしましょう。

すると、以下の Rmd ファイルが表示されます。

 

自身の解析ノートを作るときには、
赤枠で囲われた Rmd ファイルの部分にコードや文字を書いていきます。
(書き方や見方については、下のボックスで説明します。)

今回はサンプル確認なので、Rmdファイルはそのままの状態で良いです。


Rmd ファイルの記述が終了したら、knitr(上の画像の赤矢印の先)を押します。
この時、Encoding に関する設定画面が出たら、default で OK です

すると、最終的な出力結果である、以下の html ファイルが出力されるはずです。
Rmdファイルをはじめて保存するときには保存画面が開かれるので、
保存したい場所を選択して、任意のファイル名を入力しましょう。

(この Rmd ファイルを保存した場所が、RMarkdownで解析する際の
 作業ディレクトリになります。)

 

 

上記のような html ファイルが出力されたら完成です。
これが R Markdown で作成する「解析ノート」のサンプルになります。
図や文字、コードが1つのファイルにまとまっていることが分かります。

(3)Rmd ファイルの編集

Rmd ファイルは大きく3つの要素から構成されます。
それが YAML ヘッダ、チャンク、Markdown記法で書かれる文章です。

 


YAML ヘッダ



YAML ヘッダは --- と --- で囲まれた部分のことで、
最終的に出力されるファイル全体に関する設定を行う場所です。
出力形式は html のほかに、PDF や Word, PowerPoint 形式にも対応しています。
(ただし、html 形式が一番使いやすいと思います。)


出力形式のほかに、出力時の見た目に関しても、以下のように細かく設定できます。


チャンク

 

チャンクは '''{r } と ''' で囲まれた部分のことで、解析用のコードを書く場所です。
1つのチャンク内に複数のコードを書くことができますが、
チャンクごとに名前をつけることができるため *、
まとまった処理ごとにチャンクを作成した方が解析しやすいです。

 

チャンクのコードを実行する場合、R Studio のスクリプト上での実行時と同様、
コードの書かれた部分にカーソールを置いて「Ctrl + Enter」を押します。

チャンクに含まれるコード全てを実行する場合、▶ボタン(上図の青矢印の先)を
クリックします。
今あるチャンクより上にあるチャンク全てを実行する場合、
▼ボタン(上図の赤矢印の先)をクリックします。

なお、チャンクの後に続けてチャンクを書く (=「文章」を書かない) こともできます。


*チャンク名をつけておくと、Rmdファイルが表示されている画面の左下にある
 (Top Level) ボタンをクリックすることで、任意のチャンクに素早く移動する
 ことができます。

 

文章

YAMLヘッダ や チャンク の書かれていない場所には、文章を書きます。
この文章は Markdown記法と呼ばれる書式に従って書きます。
文字だけの書き込みであれば Word に打ち込む時と同じように入力すればよいですが、
数式や数学記号、画像などを挿入したい場合には、Markdown記法で書く必要があります。
(「Markdown記法」で検索すると、いろいろなサイトで書き方が紹介されています。)