見出し画像

数学こぼれ話#29 ~データを直線で近似してみよう~

皆さん、こんにちは。身のまわりには、「高校数学」の力を借りると一歩深く理解できる事柄で満ちています。今回は「データの近似」と称して、最小二乗法の仕組みについて見ていきたいと思います。統計に関係する用語を少し使いますので、知識に不安のある方はこちらの記事もどうぞ。(数学こぼれ話#10 ~相関係数を徹底理解~

〇似ている直線を引こう

理科の実験などで、いくつかプロットした点をもとに「直線を1本引きましょう」と言われたことはありますか? あるいは、Excelなどを使って「似ている直線」を描いたかもしれません。<図1>も見てみてください。点線で示した直線は、確かに5個の点から「自然」に引ける線と言えそうですが、「これで一番正確か?」と言われると疑問が残ります。Excelなどで描いた直線であれば一番正確でしょうが、すると今度は「どのようにして直線は決まっているのか?」という疑問が出てきます。

〇最小二乗法のしくみ

近似直線を求めるポピュラーな方法に、「最小二乗法」というものがあります。Excelでは、”=LINEST”という関数を使うと一発で引くことができます。「直線を決定すること」は「傾き$${a}$$と切片$${b}$$を決定すること」と同じですが、最小二乗法では次のような発想で、傾き$${a}$$と切片$${b}$$を求めます。<図2>をご覧ください。

波線で示したのは、「$${n}$$個分の誤差を集めたもの」と考えてもらえばOKです。波線の値が小さければ小さいほど、$${n}$$個のデータを上手く直線$${y=ax+b}$$で近似できた、と言ってよさそうですね。では、$${a}$$と$${b}$$の求め方を眺めてみましょう。展開すれば2次式なので、(かなり気合を入れれば)実際に計算することもできます。

〇計算してみよう

展開して整理すると、次のような式が得られます。

思わず「…」となってしまう式ですね。しかし、$${a^2}$$と$${b^2}$$の係数が共に正の2次式なので、「平方完成して2乗を作る」という基本手順を踏んでいけば、(*)が最小になるような組$${(a,  b)}$$を求められます。計算は省略しますが、最終的に次のような「公式」が得られます。

Excelであれば、平均は”=AVERAGE”、分散は”=VAR”、共分散は”=COVARIANCE”で求まりますので、具体的に色々と計算してみると面白いかもしれません。

 それでは、次の「こぼれ話」でお会いしましょう!


■大学入試情報を無料でお届けします!

■大学受験の総合情報サイト→ぜひホーム画面に追加してご確認ください!

■対話シリーズを含む「数学こぼれ話」過去の記事はこちら

■入試問題分析・解法に関する記事はこちら


Y-SAPIXでは、大学受験に関する情報を発信しております。週ごとの定期配信で、お手軽に情報を入手したいという方は、こちらのボタンから「メルマガ会員登録(無料)」へお進みください!