観察や実験によって仮説を検証していく実証研究では、データを取得した後に、そのデータを解析しなければなりません。
本ガイドでは、データ解析に役立つフリーソフトウェアの R についてご紹介します。
ちなみに、本ガイドを執筆している私はバッタの逃避行動を研究している大学院生で、毎年、夏から秋にかけて野外でバッタを追いかける日々を過ごしています。バッタのいない冬から春にかけて、 R を使って実験データの解析を進めています。私のように情報系・理論系でもない、実験系の学生にとっても、R は扱いやすいデータ解析用のツールだと思います。
データ解析と一言で表しても、その遂行にはデータの整理、図化、統計解析など、
様々な過程を経る必要があります。
このデータ解析には単純作業や計算の得意なコンピュータを用いることが一般的です。
コンピュータを用いたデータ解析は、様々なソフトウェア(以降 ソフト)を
使用して行われます。
皆さんに馴染みのあるソフトは Microsoft の Excel ではないでしょうか。
私も学部1~3年生までは、Excel のみを使用して実験のレポートを作成していました。
Excel はより多くの人が扱うデータの解析を簡単にできるソフトだと思います。
しかし、卒業研究が始まって他の人が扱わないようなデータを解析するようになると、
Excel でのデータ解析は困難になってきます。
そのような人にとって便利なデータ解析ソフトの1つが R です。
フリーソフト という利点を活かして 世界中の利用者が絶えず開発を進めている ため、
データ解析に必要なほとんどの作業が R を使えば簡単にできます。
また、R は R 言語と呼ばれるプログラミング言語を用いて操作するソフトであるため、
自身でプログラムを書けば、世界中の誰も使用していないような解析も可能です。
以下の R で実施できるデータ解析の手順の内、
本ガイドでは統計解析を除く部分を扱います。
Rは以下のサイトからダウンロードできます。
日本の場合、ダウンロードは2か所のミラーサイトのいずれかから行います。
国別のミラーサイトを選ぶのは、地理的に近い方がダウンロードの時間が短いためのようです。
ダウンロード時には64 bit版と32 bit版の両方がダウンロードされますが、
基本的には 64 bit 版 (R x64) のみを使って作業を進めます。
本ガイドでは、64 bit 版の R (ver. 3.5.1) をWindows 10で使用した例で説明をします。