Skip to main content
It looks like you're using Internet Explorer 11 or older. This website works best with modern browsers such as the latest versions of Chrome, Firefox, Safari, and Edge. If you continue with this browser, you may see unexpected results.

★「動物の行動研究」入門: 4|解析する

動物の行動を研究する際のキホンを紹介。

目次

はじめに

1|問いを立てる

2|計画を立てる

3|観察・実験する

4|解析する
 - データ解析の流れ
 - Rを使う
 - 統計解析

5|まとめる

おわりに

データ解析の流れ

データを集め終わったら、そのデータを解析していきます。

解析は通常、以下の流れで行われます。

 

 

ポイントは
一方向に進むわけではない(行ったり来たりを繰り返して進める)
すぐに数式を扱う統計解析をするわけではない
ということです。

 

データ解析というと
統計学を使った数式による解析のイメージを持つ方が多いように思われます。

データ解析の経験がある人の中には、
「難しい数式をいじりまわしてp値を計算し、"有意" かどうかを調べる」
ことがデータ解析だと考えている人もいるのではないでしょうか。


しかし、その本質はデータを図にしてみることにあります。
データを手に入れたら様々な図を作り、どんなデータなのかしっかり観察しましょう。


<さらに詳しく>

Rを使う

RはR言語(プログラミング言語)を使ってデータ解析を容易に行える、フリーソフトです。
(公式サイト:https://cran.r-project.org/index.html

フリーソフトなので様々な外付け機能(パッケージ)が開発されており、
複雑な図の作成や統計解析でも、Rを使うことで簡単にできてしまいます。

パソコンでデータ解析を行う場合、 Microsoft Excel の利用を考えるかもしれません。

Excelは、みんながよく使うデータ解析を直観的に使いやすくしたものです。

そのため、他の人があまり使わないような動物の行動のデータを扱う場合、
Rを使った方がより簡単にデータを解析
できます。

 

ちなみに、データ解析にはPythonというプログラミング言語もよく使われます。
機械学習を使って解析したい場合には、Pythonの方を使うと良いでしょう。


<さらに詳しく>

統計解析

データ解析においては「データの図化」が大切、と言ってきましたが、
図からの視覚的な判断だと、人によって違う結果を導くかもしれません。

 

例えば、バッタのオスとメスの体長を測定して、以下の図(ヒストグラム)を得たとします。



この図から、オス(上)とメス(下)の体長に違いがあると言えるのでしょうか、言えないのでしょうか。
ある人は「違いがある」と判断するかもしれませんし、

別の人は「違いはない(目の錯覚だ)」と判断するかもしれません。

 

統計解析はこのように図からの判断が難しい場合に、
客観的な判断基準を提供してくれる貴重なツールとなります。

 

統計解析の手法には様々な種類のものがあるので、ここで詳しくは説明しません。
ざっくりとした流れを説明をすると、

 1)帰無仮説(否定したい仮説。上の図だとバッタのオスとメスで体長に差はない)を立てる
 2)帰無仮説の正しさを確認するための目安となる量(検定統計量)を決める

 3)確率モデルを使い、帰無仮説が正しいと仮定したときに
   検定統計量がとりうる値とその確率の関係(検定統計量の分布)を求める
 4)この検定統計量の分布を使い、帰無仮説が正しいと仮定したときに
   検定統計量の値が実際のデータから算出される値か
   それより稀な値をとる確率(p値)を計算する
 5)もしp値がかなり小さければ、
   
帰無仮説の下で実際のデータが示すような検定統計量が得られる確率は
   かなり小さいのだから、帰無仮説は正しくなさそうだと考える

ということを、数式を使って行います。
(この流れは先に説明した「仮説」と「予想」の流れとよく似ています。)

 


 


ただし、統計解析の手法はいずれも前提条件をいくつか仮定しているため、
自身の得ているデータがその前提条件を満たすのかを事前に確認する必要があります。

そのためには、やはりデータの図化が必要となります。


<さらに詳しく>
統計解析についての全体的な解説としては、
上で紹介した『統計思考の世界:曼荼羅で読み解くデータ解析の基礎』が参考になります。

 

その他に以下の文献も参考になります。


また、統計解析においてよく使われるのが「p値」です。

この「p値」の定義は
「帰無仮説の下で注目した検定統計量がデータの示す値よりも稀な値をとる確率」と

はっきりしているのですが、その扱いについては様々な議論* が行われています。

 

「p値」について詳しく書かれた本には『P値:その正しい理解と適用』がありますが、
個人的に、これはやや数学の好きな人向けな気がします。

数学が好きではないものの「p値」について知りたいという方は、
まず以下の文献に目を通すのが良いと思います。

 

ーーーーー
大久保祐作, 會場健大 (2019).「
p値とは何だったのか(Fisherの有意性検定とNeyman-Pearsonの仮説検定を超えるために)」『 生物科学』, Vol. 70, No. 4, pp. 238-251.

ーーーーー


*  p値に関する議論の日本語の記事として、2019年の『Nature ダイジェスト』Vol. 16, No. 6 に
 「
統計的有意性を巡る重要な論争」(オープンアクセスリンク先という記事があります。

 

 

次のページ:まとめる