2014年7月18日金曜日

Point Distributionから見る今年の広島東洋カープ

総得点から勝率予想をすることは,セイバーメトリクスの世界では良く行われていることではあります.有名なところでは,ピタゴラス勝率と呼ばれているもので,得点数$a$,失点数$b$とした時に,チームの勝率Pが $$P=\frac{a}{\sqrt{a^2+b^2}}$$ であたえられるというものです.こんな簡単な式ですが案外うまくフィッティングするのでよく用いられているのですが,理論的な考察としてなぜこの式が有効なのかという議論をしているものはあまり見たことがありません.おそらく,野球の得点が入るという現象がrandomの結果として考察しづらいことが要因ではないかと考えています.
野球において得点が入る,とはどういうことかを考えてみます.当たり前ですが,点が入るということは3アウトになるまでにランナーが本塁まで進塁するというふうに考えることが出来ます.なので,ヒットが3本続いたとしても点が入らない場合もある一方で,本塁打が出れば確実に点が入り,また安打が一つの回に固まると,本塁打以上の大量得点が得られます.なので,打撃結果と得点が単純な比例ではありません.
実際,サッカーの得点や野球の一試合あたりの本塁打数の分布はポアソン分布に従いますが,野球の得点はポアソン分布よりも,高得点側の確率が高い分布になってる気がします.

Point Distribution (@2013 横浜ベイスターズ)

2013年カープの得点分布でも,ポアソン分布のピークがなだらかになり,高得点側に推移したような形となっています.他のチームに関してもまあ概ねこのような分布になっているので,得点がポアソン分布に従うということを仮定するのはマズイかなといえると思います.

で,やりたいのは今年去年よりだいぶ健闘しているカープの得点分布が去年と比べてどうなっているのか見てみましょうということです.結果は以下の様な感じ
Point Distribution(@広島東洋カープ 2012~2014)
縦軸は得点確率,横軸は得点数

去年と比べて低得点の割合が減少していることがわかります.まあそもそも平均得点が3.8→4.3になってるので右に寄ることは当たり前なのですが,得点分布自体が全体通して均一になっています.やっぱり今年奮起してるエルドレッドの長打(本塁打)のお陰で,得点が安定して取れるようになっているからなのかはたまた別の理由からなのか.失点分布はそれほど変わってない様子なので,安定して4,5点取るっていうのは勝率アップにつながるのかも.

チームの長打率とか出塁率とかとリンクさせて分布傾向を出したりすると,同じ平均得点のチームでも,強い弱いの評価が出来て面白そうっすね.

ちなみに巨人はこんな感じ どっかで今年の巨人はOPS.750~.800の打者ばかりで圧倒的に打てる打者がいないというのを見ましたが,そのせいで高得点側の確率が上がって,6,7点あたりの確率が低い事につながってるのかも.

2014年7月17日木曜日

数列の収束における有界単調数列の使い方

$$ a_{n+1}>a_n, a_n>1 \Rightarrow {a_n} は下に有界な単調数列 $$

定理:有界単調数列は収束する 単調増加で,上に有界な数列${a_n}$が集合$A=\left\{a_1,a_2,......\right\} $の上限$\alpha$に収束することを示せば良い. $\forall\varepsilon>0$に対して$\alpha-\varepsilon$は$A$の上界ではない. $${n>N_0 \Rightarrow \alpha-\varepsilon<{a_n}<\alphaなるn_0が存在する}$$ このとき $$|a_n-\alpha|<\varepsilon$$ であるから,a_n$rightarrow\alpha$が示された.