野球を数字で見るブログ

Houston Astrosと読売ジャイアンツのファンです。 本ブログで、「野球を数字で見る」面白さがわかります。 主に、日本プロ野球での成績を数字で見て考察します。 本ブログで扱うデータに関して、正確性は保証されておりません。本ブログの情報を元にデータを作成して起こる損害に対しまして、一切の責任を負いません。ご了承ください。

タグ:出塁率

はじめに
 ホームラン打者の特徴とは何なのかだろう。
 本記事では、ホームラン打者の特徴は「選球眼に優れていること」という仮定をし、ホームラン数と四球数の相関を調べていく。
スポンサーリンク
 
セリーグからのサンプル
 本記事では、セリーグの2015年シーズンから2018年シーズンの計4シーズンにおいて、規定打席に到達した選手を対象に、データをサンプルした。

 計4シーズンで、縦軸にホームラン数、横軸に四球数を取ったグラフを描いたのが下図である。

ホームランと四球数の相関

 この図は一見すると、それほど意味を持たない図に見える。
 満遍なく分布していて、四球数が100近くあるのにホームラン数が1桁の選手もいれば、四球数が30ほどなのにホームラン数が40本近くある選手もいる。

グラフの意味
 意味を持たないように見えるが、一本の直線を引いてみるとその様子をわかりやすくする。
 それを描いたのが下図である。

ホームランと四球数の相関2

 この赤い一本の線を近似曲線と呼ぶ。全ての点に関し、細かいことを無視して四球数とホームラン数の関係がおおよそわかるような線である。
 この赤い線を見ると右肩上がりなのがわかる。
 右肩上がりということはすなわち、正の相関関係があるということである。
スポンサーリンク
 
相関関係

 ホームラン数と四球数の相関係数は、およそ0.392であった。

 少し説明に入るが、相関係数0.00の場合は物事Aと物事Bが全く関係性がないものであり、1.00の場合は物事Aと物事Bが完璧に関係性があるものとされる。
 例えば「本を読めば読むほど、野球の打率が上がる」などということが相関係数が0.00に近い、すなわち全くと言っていいほど関係がないということである。
 逆に、相関係数が1.00の場合は、「ランニングすればするほど、カロリーを消費する」という直接関係のあるところに位置し、相関係数が1.00に近いということになる。
 つまり、
相関係数が0.00から1.00に近づくに従って、「1つの物事A」と「もう1つの物事B」の相関が出てくる、すなわちAとBが関係してくるということである。 

実は弱い相関
 上記で説明したことを考えると、三振と本塁打の相関係数が0.392という数字になるということは、0.00〜1.00の範囲内では0.00寄りであり、”弱い相関”にあると言える。
  先ほども述べたように、四球数が100近くあるのにホームラン数が1桁の選手もいれば、四球数が30ほどなのにホームラン数が40本近くある選手もいる。

つまり、正の相関があることは確かだが、
ホームランを打つ選手は必ず選球眼がいいとは限らない
と言えるのだ。
 最初に仮定した、ホームラン打者の特徴は「選球眼に優れていること」ではないことがわかった。

まとめ
 ホームラン打者は打てる球を見極めてホームランを打つと考えていた。
 さらに、ホームラン打者は敬遠されることが多く、四球数が多くなるとも考えていた。
 しかし、実際はホームランと四球数はそれほど関係がないことがわかった。

 ホームランと出塁率の相関関係を調べてもよかったが、出塁率は打率の影響を受けるため、本記事ではホームランと四球数の相関関係を調べてみた。

関連記事


↓ブログランキングに参加中です!応援よろしくお願いします!
にほんブログ村 野球ブログへ

ぜひ、Twitterのフォローお願いします。
最新記事の情報はTwitter、にほんブログで投稿します。

ブログランキングの方も是非!



 ホームラン打者の特徴とは何なのかだろう。
 本記事では、ホームラン打者の特徴は「選球眼に優れていること」という仮定をし、ホームラン数と四球数の相関を調べていく。

スポンサーリンク

 本記事では、セリーグの2015年シーズンから2018年シーズンの計4シーズンにおいて、規定打席に到達した選手を対象に、データをサンプルした。

 計4シーズンで、縦軸にホームラン数、横軸に四球数を取ったグラフを描いたのが下図である。

ホームランと四球数の相関

 この図は一見すると、それほど意味を持たない図に見える。
 満遍なく分布していて、四球数が100近くあるのにホームラン数が1桁の選手もいれば、四球数が30ほどなのにホームラン数が40本近くある選手もいる。
 意味を持たないように見えるが、一本の直線を引いてみるとその様子をわかりやすくする。
 それを描いたのが下図である。

ホームランと四球数の相関2

 この赤い一本の線を近似曲線と呼ぶ。全ての点に関し、細かいことを無視して四球数とホームラン数の関係がおおよそわかるような線である。
 この赤い線を見ると右肩上がりなのがわかる。
 右肩上がりということはすなわち、正の相関関係があるということである。
 ホームラン数と四球数の相関係数は、およそ0.392であった。

 少し説明に入るが、相関係数0.00の場合は物事Aと物事Bが全く関係性がないものであり、1.00の場合は物事Aと物事Bが完璧に関係性があるものとされる。
 例えば「本を読めば読むほど、野球の打率が上がる」などということが相関係数が0.00に近い、すなわち全くと言っていいほど関係がないということである。
 逆に、相関係数が1.00の場合は、「ランニングすればするほど、カロリーを消費する」という直接関係のあるところに位置し、相関係数が1.00に近いということになる。
 つまり、
相関係数が0.00から1.00に近づくに従って、「1つの物事A」と「もう1つの物事B」の相関が出てくる、すなわちAとBが関係してくるということである。 

 上記で説明したことを考えると、三振と本塁打の相関係数が0.392という数字になるということは、0.00〜1.00の範囲内では0.00寄りであり、”弱い相関”にあると言える。

  先ほども述べたように、四球数が100近くあるのにホームラン数が1桁の選手もいれば、四球数が30ほどなのにホームラン数が40本近くある選手もいる。

つまり、正の相関があることは確かだが、
ホームランを打つ選手は必ず選球眼がいいとは限らない
と言えるのだ。
 最初に仮定した、ホームラン打者の特徴は「選球眼に優れていること」ではないことがわかった。

 ホームラン打者は打てる球を見極めてホームランを打つと考えていた。
 さらに、ホームラン打者は敬遠されることが多く、四球数が多くなるとも考えていた。
 しかし、実際はホームランと四球数はそれほど関係がないことがわかった。

 ホームランと出塁率の相関関係を調べてもよかったが、出塁率は打率の影響を受けるため、本記事ではホームランと四球数の相関関係を調べてみた。
スポンサーリンク

↓ブログランキングに参加中です!応援よろしくお願いします!
にほんブログ村 野球ブログへ

ぜひ、Twitterのフォローお願いします。
最新記事の情報はTwitter、にほんブログで投稿します。

ブログランキングの方も是非!



 打てる打者の特徴とは何なのか?
 打率なのか?ホームランなのか?
 本記事では、打率とホームランではなく、出塁率と長打率についての相関を元に打てる打者の特徴を見ていく。
スポンサーリンク

 打率は運に左右されやすい。ボテボテの内野安打も快心の二塁打も同じヒット1本と扱われるからだ。
 そこで、長打率を導入する。長打率はシングルヒットからホームランまで、4パターンのヒットを全て別々に考えて算出されるため、打率よりは運の要素が薄い。

 そして出塁率は基本的に四球数に依存する。四球を選ぶことは選球眼がいい打者が行う技術的な行為である。これも運の要素は打率よりも薄い。

 この2つの相関性を考えた場合、どうなるのか?既にサンプルのある2017年シーズン
の全試合のデータを元にセリーグの個人成績から相関性を見ていく。
 まず、出塁率と長打率の相関係数はおよそ0.50であった。

 少し説明に入るが、相関係数0.00の場合は物事Aと物事Bが全く関係性がないものであり、1.00の場合は物事Aと物事Bが完璧に関係性があるものとされる。
 
例えば「本を読めば読むほど、野球の打率が上がる」などということが相関係数が0.00に近い、すなわち全くと言っていいほど関係がないということである。
 逆に、相関係数が1.00の場合は、「ランニングすればするほど、カロリーを消費する」という直接関係のあるところに位置し、相関係数が1.00に近いということになる。
 つまり、
相関係数が0.00から1.00に近づくに従って、「1つの物事A」と「もう1つの物事B」の相関が出てくる、すなわちAとBが関係してくるということである。
スポンサーリンク

 出塁率と長打率の相関係数はおよそ0.50であるため、比較的相関が強いと言える。
 2017年シーズン、セリーグ規定打席に立った選手計28名の出塁率と長打率の分布をグラフに表したのが下の図である。

出塁率と長打率1
 
 この散布図だけでは意味がよくわからないものに見える。しかし、一本の直線を引いてみると、若干ながらその様子がわかる。それが下の図である。

出塁率と長打率3

 この赤い線は傾きが1の直線である。散布図だけでは全く意味のないものに見えたものが、この直線を引くことによって、意味がわかるようになる。傾き1の直線というのは「相関係数が1.00」の分布を表すものなのだ。つまり、相関係数が1.00の場合は黄色のプロットは赤線の上に全て乗ることになる。
 出塁率と長打率の場合、相関係数が0.50であるためそのようなことは起きないが、散布図を見る限り、黄色のプロットは赤線同様に右上がりに増加しているのがわかる。
これが相関係数0.00の場合は、右上がりどころか満遍なく黄色のプロットが広がるようになる。

 結局何が言いたいかというと「出塁率の高い打者は、長打率も高い可能性が十分にある」ということだ。それが右上がりのグラフの意味するところだ。例えば2017年の巨人のマギーは長打率が3位で出塁率は5位を記録しているため、出塁率と長打率は算出する式が各々では全く関係ないが、相関を求めると無関係ではないと言えるのだ。

 結局、「打てる打者は、出塁率がよく、なおかつ長打率も良い傾向にある」と考えられるのだ。
スポンサーリンク

ブログランキングに参加中です!応援よろしくお願いします!
にほんブログ村 野球ブログへ

ぜひ、Twitterのフォローお願いします。
最新記事の情報はTwitter、にほんブログで投稿します。

ブログランキングの方も是非!



このページのトップヘ