回帰分析のモデルが複雑になると、説明変数が一つでなく、複数になり、場合によっては何十という場合もあります。このような回帰分析のことを、「重回帰分析」といいます。 重回帰分析を「わからない」「サクッと理解したい」人向けに「例題付き」でわかりやすく簡単に解説します。重回帰分析は統計解析(多変量解析)で最も広く応用されている分野の1つです。また、ai・機械学習の勉強にも必須です。 キーワードを入力してください「重回帰分析」とは、統計学上のデータ解析手法のひとつです。統計用語で「重」は「複数」、「回帰」は「因果関係」を意味します。つまり重回帰分析とは、ある結果(目的変数)を説明する際に、関連する複数の要因(説明変数)のうち、どの変数がどの程度、結果を左右しているのかを関数の形で数値化し両者の関係を表し、それを元にして将来の予測を行う統計手法のことです。たとえば小売業で、10店舗ある既存店の売場面積、従業員数、販売商品数、駐車場の収容台数、駅からの距離など複数の要因が、売上高という結果をどの程度決定づけているのか分析し、出店予定の新店舗の各変数から、将来の売上高を予測するといった場合に利用されます。応用範囲が広く、要因と結果という関係を定式化しマーケティング施策の効果測定が出来ることから、売上予測や、プロモーション戦略策定などマーケティングの現場で使われることの多い手法です。回帰分析では、さまざまな要因の間にどのような関係があるのかを分析します。たとえば広告費から売上を予測するとします。このように1つの要因から結果を予測することを「単回帰分析」と呼びます。具体的には、広告費をいくらにしたら売上がいくらになったという実績データを数多く集め、両者の関係を「回帰係数」という数字で表します。説明変数を広告費など単一の要因だけではなく、より増やして売上を予測するのが、「重回帰分析」です。重回帰分析は、変数間の相関関係から、目的変数と説明変数の関係を「重回帰式」という方程式で表す作業です。その手順を、例を挙げて見ていきましょう。そして、エクセルの分析ツールで重回帰分析を行っていきました。無料のフリーウェア「R」や、企業や学術・研究機関では「JMP」や「SPSS」といった有料ソフトもよく利用されています。候補となる説明変数をひとつひとつ加えたり、減らしたりしながらデータの精度を高める「ステップワイズ法」で最適な組み合わせを探っていきました。説明変数の個数は多すぎても少なすぎても良い分析結果は得られません。数は7個程度という場合が多いようです。試行錯誤の結果、自社店舗の売上高は、下の6個の説明変数によって説明するのが最も適切だとわかりました。売上額  回帰係数     回帰係数    回帰係数      定数項「回帰係数」は「偏回帰係数」とも呼ばれますが、大きさが変数の単位に依存するためその数字自体にあまり意味はなく、ある要因に比べて他の要因の係数が大きいからといってその要因の売上額への影響が大きいというわけではありません。影響度の大きさは一般的に、解析ソフトで出力される「標準化係数」という数値を使います。「定数項」とは「y切片」とも呼ばれ、説明変数が変わっても固定されたままの値のことを指します。この例では、店舗面積など各説明変数によって変動しない、売上高の「ベース」を意味します。以上が、重回帰分析の基本的な手順例になります。重回帰分析は、マーケティングにおいて頻繁に使われる「多変量解析」のための分析手法のひとつです。多変量解析とは、複数の変数を持つデータの関連性を明らかにする統計手法のことで、重回帰分析以外にも、多くの分析手法があります。解析の目的や、扱う対象となるデータの種類によって、表のように分類できます。多変量解析の目的は大きく分けて、購入率、売上や当選率など何らかの結果を「予測」することと、学校の試験結果を文系と理系に集約するなど「要約」することの二つに分けられます。さらに扱うデータが数字による量的変数か、性別などの数字ではない質的変数かによって解析手法が異なります。それぞれを簡単に解説します。※解説に使用しているデータ、図版はダミーのものですインテージへのお問い合わせ、各種資料のダウンロード、メールマガジンの登録、などをご案内しています。株式会社インテージ 重回帰分析のやり方. 回帰分析,レポートに関するQ&Aの一覧ページです。「回帰分析,レポート」に関連する疑問をYahoo!知恵袋で解消しよう! intage 株式会社インテージ 重回帰分析とは、複数の説明変数 \(x_1,x_2,\cdots,x_k\) によって目的変数 \(y\) の変動をどの程度説明できるかを分析する手法です。  例えば、気温 \(x_1\) と価格 \(x_2\) によって販売量 \(y\) の変動のほとんどを説明できることが分かれば「明日の気温は \(26\) 度の予報だから、値引き価格の \(180\) 円で販売すると在庫切れになりそうだ。明日は通常価格の \(200\) 円で販売しよう」といった判断が可能になり、利益の最大化につながります。 このように、重回帰分析は身近にあるさまざまな課題の解決に役立つツールです。道具の1つとして、ぜひ使いこなせるようになっておきたいところ。 そこで今回は、重回帰分析のエクセルでのやり方と結果の解釈の仕方について書いていきます。目次 初めてExcelでデータ分析をする場合には、下準備が必要です。 Excel画面左上の「ファイル」⇒「オプション」⇒「アドイン」から「Excelアドイン」の「設定」をクリックしてください。 次に、アドインの「分析ツール」にチェックを入れてOKをクリック。すると「データ」タブの右端に「データ分析」が出てきます。   それではさっそく、Excelで重回帰分析をやってみましょう。 一般に、不動産の価格は「部屋が広いほど価格は高くなる」「築年数が長いほど価格は安くなる」「最寄駅までの距離が遠いほど価格は安くなる」と考えられますよね。では、具体的に「部屋が1m それを以下の重回帰式を求めることで分析していきます。  今回使用するデータはこちら。20個の不動産の価格・広さ・築年数・最寄駅までの所要時間の一覧です。  「データ」タブの「データ分析」から「回帰分析」を選んでOKをクリック。 入力Y範囲に「目的変数となる価格のセル」、入力X範囲に「説明変数となる広さ・築年数・最寄駅までのセル」を入力します。  「OK」をクリックすると、重回帰分析の計算結果が表示されます。   先ほどの結果を見て「たくさん数字が並んでいて読み取るのが大変そう・・・」と思った方もいるかもしれませんが、特に重要なのは以下の  「X値 1」は「 \(x_1\):広さ」、「X値 2」は「 \(x_2\):築年数」、「X値 3」は「 \(x_3\):最寄駅までの所要時間」のことで、係数はそれぞれ 「重決定 R2」は、今回得られた重回帰式の ここから、今回の重回帰分析で得られた重回帰式は以下の通りで、その決定係数は \(R^2=0.733\) と中々当てはまりの良い結果が得られたことが分かります。  決定係数 \(R^2\) は説明変数の個数が増えるほど大きくなってしまう欠点があるので、複数の回帰式を比較する際などには「補正 R2」で表される自由度調整済決定係数 \(\tilde{R}^2=0.683\) を使います。偏回帰係数は「 「 「P-値」は「\(β_i=0\)と仮定した場合に今回以上に極端な \(t値\) が得られる確率 一般にp値が \(0.05\) よりも小さいと「\(β_i=0\) の仮定の下では各 \(t値\) が自由度 \(n-k-1\) の 例えば、\(β_1\) のp値は \(0.005\) ⇒もし \(β_1=0\) だとしたら今回のような結果が得られる確率は\(0.5%\)しかない⇒ \(β_1=0\) とは考えにくい⇒「部屋が広ければ広いほど不動産の価格は高くなる」と判断できます。一方、\(β_3\) のp値は \(0.36\) ⇒もし \(β_3=0\) だとしても今回のような結果が得られる確率は\(36%\)もある⇒ \(β_3=0\) でもおかしくない⇒現時点では「最寄駅までの所要時間が長いほど不動産の価格は安くなる」とは言い切れないと判断できます。 p値については「  最後に見ておくべきなのが、95%信頼区間。これは「データを100回取れば95回くらいはこの範囲内に真の \(β_i\) を含む」といえる範囲です。 基本的には「この範囲内に真の \(β_i\) が含まれているのだろう」と考えて分析していくことになります。 今回の結果からは部屋の広さは \(0.042<β_1<0.200\) なので「部屋の広さが価格に影響を与えるのは明らかだ」築年数は \(-1.11<β_2<-0.001\) なので「築年数も価格に影響を与えると考えられるが、もしかしたら \(0\) に近い影響量である可能性もゼロではない」最寄駅は \(-1.23<β_3<0.476\) で範囲内に \(0\) を含んでいるものの区間の幅が大きいので「最寄駅までの所要時間は価格にほとんど影響を与えない可能性があるが、大きく影響を与えている可能性も否定できないので、もっとサンプルを増やした方が良い」と判断できますね。  回帰分析とその主な目的。単回帰分析・重回帰分析・ロジスティック回帰分析の...分散とは何か。n個のデータと確率変数の分散の求め方について それではさっそく、Excelで重回帰分析をやってみましょう。 一般に、不動産の価格は「部屋が広いほど価格は高くなる」「築年数が長いほど価格は安くなる」「最寄駅までの距離が遠いほど価格は安くなる」と考えられますよね。 回帰分析では、さまざまな要因の間にどのような関係があるのかを分析します。たとえば広告費から売上を予測するとします。このように1つの要因から結果を予測することを「単回帰分析」と呼びます。具体的には、広告費をいくらにしたら売上がいくらになったという実績データを数多く集め、両者の関係を「回帰係数」という数字で表します。●単回帰分析のモデル●単回帰分析の散布図説明変数を広告費など単一の要因だけではなく、より増やして売上を予測するのが、「重回帰分析」です。◎重回帰分 …