北海道コンサドーレ札幌ベガルタ仙台鹿島アントラーズ浦和レッズ大宮アルディージャ柏レイソルFC東京川崎フロンターレ横浜F・マリノスヴァンフォーレ甲府アルビレックス新潟清水エスパルスジュビロ磐田ガンバ大阪セレッソ大阪ヴィッセル神戸サンフレッチェ広島サガン鳥栖
モンテディオ山形水戸ホーリーホックザスパクサツ群馬ジェフユナイテッド千葉東京ヴェルディFC町田ゼルビア横浜FC湘南ベルマーレ松本山雅FCツエーゲン金沢名古屋グランパスFC岐阜京都サンガF.C.ファジアーノ岡山レノファ山口FCカマタマーレ讃岐徳島ヴォルティス愛媛FCアビスパ福岡V・ファーレン長崎ロアッソ熊本大分トリニータ
グルージャ盛岡ブラウブリッツ秋田福島ユナイテッドFC栃木SCY.S.C.C.横浜SC相模原AC長野パルセイロカターレ富山藤枝MYFCアスルクラロ沼津ガイナーレ鳥取ギラヴァンツ北九州鹿児島ユナイテッドFCFC琉球FC東京U−23ガンバ大阪U−23セレッソ大阪U−23
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(4)
RSS
Column
2017 2/23 [Thu.]

2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(4)

※本コラムは2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する。(3)」の続きです

 

さて、ここまでの分析で、チームごとに対戦相手のトラッキングパラメータによって想定されるゴール数を予測するモデルを得られた。しかし2016年の結果から2017年のJ1リーグを予測する上で、考慮するべき重要な要素がある。選手の移籍だ。今オフは、各チームにおける主力・看板選手の移籍が例年よりも目立ったように思う。

※上記はごく一部であり、ここに掲載されていない選手が主力ではないという訳ではない

()表記は、J1以外のチーム(J2・海外)の移籍

 

そこでまずは、J1リーグ全選手の特徴を把握するために、各チームの特徴の違いを分析した時と同様、自己組織化マップで可視化してみる。2016年のJ1リーグ戦に450分以上出場した選手の全トラッキングパラメータを用いて可視化した結果が下記となる。

2016年のJ1リーグ戦での総プレー時間が450分以上であった選手を抜粋してマッピング

 

左下のゾーンは、ドリブラータイプが固まっている。齋藤学、宇佐美貴史(2016年シーズン途中までガンバ大阪に所属)、カイオ(2016年シーズン途中まで鹿島アントラーズに所属)、クリスティアーノ、駒井善成、ミキッチなどが該当する。中央下〜右下が司令塔、右下がボランチタイプの選手が多いようだ。このゾーンには、中村憲剛、小笠原満男、遠藤保仁などが該当する。中村俊輔は、データ上は、ドリブラータイプと司令塔タイプの中間あたり(中央下、やや左)となった。一方、右上のゾーンにはディフェンダータイプ、左中央〜左上にはフォワードタイプの選手がプロットされている。フォワードタイプの中でもドリブルで仕掛けるタイプの選手(大久保嘉人、ペトロ・ジュニオール、ピーター・ウタカなど)は下の方に、センターフォワードタイプ(レアンドロ、ジェイ、豊田陽平など)は左上にマッピングされている。このように、自己組織化マップを用いると、前情報無しでもスタッツデータのみから自動的に似た選手を近くにマッピングすることが可能となる。

※筆者は別の記事で、同様の2016年のJ1リーグ選手の自己組織化マップを作成したが、本稿とはデータ項目・期間が異なるため、上記とは結果が若干異なる。また、自己組織化マップは方向性がランダムに決まるため意味を持たず、あくまで選手間の距離のみが重要である点に留意。

 

さて、この結果を参照しながら、移籍選手の影響をどのように見積もるかについて考察する。まずは、各チームから、抜けた選手分のスタッツデータを間引く。次に、上記自己組織化マップを参照しながら、抜けた選手の穴を、既存の選手・新加入の選手含め、誰が埋めることになりそうか、シーズン前の練習試合などの情報も含め、想定スタメンを予想し、新たな出場選手分のデータを加える。なお、新加入選手のうち、J1リーグ以外から加入した、未知の選手(横浜F・マリノスのウーゴ・ヴィエイラ、ダビド・バブンスキー、ミロシュ・デゲネグなど)は、おそらく近いタイプと思われる選手のデータを参考に入れる。

 

さらに、直近の富士ゼロックススーパーカップの結果(鹿島3-2浦和)をもとに、モデルを更新することを考える。残念ながら執筆時点で、手元に富士ゼロックススーパーカップのスタッツデータは無いので、XGboost自体のモデルを更新するのではなく、ベイズの定理を用いることにする。ベイズの定理とは、事前確率と尤度から事後確率を求める定理で、下記のように表される。

今回は、ゼロックススーパーカップのデータDが与えられた時、鹿島と浦和の対戦における、それぞれの平均値θに基づくゴールの事前確率分布がどのような事後確率分布に変化するかを推定する。事前確率分布と尤度から事後確率分布を求める際は、上記の式から、下記のようにして求められる。

ここで平均値θが与えられたときのゴールの尤度は、冒頭で述べたとおりポワソン分布に従うことが知られている。そこで、ゴールの平均値自体(の事前分布)は、ガンマ分布に従うと仮定すると、事後分布もガンマ分布に従うようになる(このような、特定の尤度のもとで事前・事後の分布が同じになる関係を自然共役分布という)。これにより、更新された平均値θでのポワソン分布に従うゴール発生確率が求められる。 


「2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(5)」に続く

このページをツイートして、フォロワーに広めよう!
Archive
コンサドーレ札幌, ベガルタ仙台, 鹿島アントラーズ, 浦和レッズ, 大宮アルディージャ, 柏レイソル, FC東京, 川崎フロンターレ, 横浜Fマリノス, ヴァンフォーレ甲府, アルビレックス新潟, 清水エスパルス, ジュビロ磐田, ガンバ大阪, セレッソ大阪, ヴィッセル神戸, サンフレッチェ広島, サガン鳥栖, モンテディオ山形, 水戸ホーリーホック, ザスパクサツ群馬, ジェフユナイテッド千葉, 東京ヴェルディ, FC町田ゼルビア, 横浜FC, 湘南ベルマーレ, 松本山雅FC, ツエーゲン金沢, 名古屋グランパス, FC岐阜, 京都サンガF.C., ファジアーノ岡山, レノファ山口, カマタマーレ讃岐, 徳島ヴォルティス, 愛媛FC, アビスパ福岡, V・ファーレン長崎, ロアッソ熊本, 大分トリニータ, J1, J2, J3, 日本代表, 五輪代表, ルヴァンカップ, ワールドカップ, レビュー, プレビュー, ACL, ベストイレブン, グルージャ盛岡, ブラウブリッツ秋田, 福島ユナイテッドFC, 栃木SC, Y.S.C.C.横浜, SC相模原, AC長野パルセイロ, カターレ富山, 藤枝MYFC, アスルクラロ沼津, ガイナーレ鳥取, ギラヴァンツ北九州, 鹿児島ユナイテッドFC, FC琉球, Jリーグ・アンダー22選抜, FC東京U-23, ガンバ大阪U-23, セレッソ大阪U-23, ロンドン五輪, 海外日本人選手, トラッキングデータ, 選手指標開発
Jリーグスタジアム
PICK UPmore
2017 8/8 [Tue.] 新開発の「チームスタイル指標」が示す、今Jリーグで見ておくべきチームとは。 今季のJリーグでは、“ハイプレス&ハイライン”戦術で評判となったフアン エスナイデル監督が率いるジェフユナイテッド千葉や、ポゼッションサッカーを信条とする大木 武監督が就任して改革が進むFC岐阜などが面白いサッカーをするチームとして話題に上ることが多い。また、Jリーグを日常的に追い掛けているあなたは、Jリーグをあまり見ない友人にこんな質問をされた経験があるかもしれない。「今、どのチームの試合を見に行けばいい?」「どのチームのサッカーが面白い?」と。データスタジアムが運営するFootball LABでは、当社で取得しているプレーデータとトラッキングデータ(J1のみ)を組み合わせた解析により、これまで定性的に語られていたチームのプレースタイルを可視化することを目的として「チームスタイル指標」を開発。簡単に説明をすると、全試合のプレーデータからいくつかの種類に攻撃パターンを分類し、それぞれのパターンにおける攻撃の試行回数を素にしたリーグ内での偏差値をはじき出している。トラッキングデータを取得しているJ1では、各シチュエーションにおける走行距離やポジショニングから、攻守の切り替えや守備陣形といった守備データを扱うことも可能となった。「チームスタイル指標」における各項目の詳細な説明は割愛するが、どんな項目があり、その項目はどういったプレーを指すのか。気になるあなたは、『チームスタイル指標とは』のページをご覧いただきたい。
2017 7/14 [Fri.] 終盤の失点が大幅に減少。躍進するセレッソ大阪
2017 6/2 [Fri.] 勝ち抜くためには縦ポン推奨? ~J3というカテゴリー~
Column more
2017 8/8 [Tue.] 新開発の「チームスタイル指標」が示す、今Jリーグで見ておくべきチームとは。 今季のJリーグでは、“ハイプレス&ハイライン”戦術で評判となったフアン エスナイデル監督が率いるジェフユナイテッド千葉や、ポゼッションサッカーを信条とする大木 武監督が就任して改革が進むFC岐阜などが面白いサッカーをするチームとして話題に上ることが多い。また、Jリーグを日常的に追い掛けているあなたは、Jリーグをあまり見ない友人にこんな質問をされた経験があるかもしれない。「今、どのチームの試合を見に行けばいい?」「どのチームのサッカーが面白い?」と。データスタジアムが運営するFootball LABでは、当社で取得しているプレーデータとトラッキングデータ(J1のみ)を組み合わせた解析により、これまで定性的に語られていたチームのプレースタイルを可視化することを目的として「チームスタイル指標」を開発。簡単に説明をすると、全試合のプレーデータからいくつかの種類に攻撃パターンを分類し、それぞれのパターンにおける攻撃の試行回数を素にしたリーグ内での偏差値をはじき出している。トラッキングデータを取得しているJ1では、各シチュエーションにおける走行距離やポジショニングから、攻守の切り替えや守備陣形といった守備データを扱うことも可能となった。「チームスタイル指標」における各項目の詳細な説明は割愛するが、どんな項目があり、その項目はどういったプレーを指すのか。気になるあなたは、『チームスタイル指標とは』のページをご覧いただきたい。
2017 7/14 [Fri.] 終盤の失点が大幅に減少。躍進するセレッソ大阪
2017 6/2 [Fri.] 勝ち抜くためには縦ポン推奨? ~J3というカテゴリー~
順位表
勝点試合得点得失
1 鹿島 58 26 44 19
2 川崎F 52 26 51 24
3 50 26 40 15
4 C大阪 48 26 50 21
5 横浜FM 48 26 32 11
6 磐田 43 26 39 14
7 G大阪 40 26 42 12
8 浦和 40 26 54 11
9 鳥栖 37 26 31 -1
10 FC東京 36 26 32 1
11 神戸 36 26 30 -2
12 仙台 32 26 30 -12
13 清水 28 26 30 -12
14 札幌 26 26 24 -15
15 広島 23 26 24 -14
16 甲府 21 26 15 -15
17 大宮 21 26 24 -22
18 新潟 11 26 17 -35
攻撃CBP
1 川崎F 600.73
2 浦和 559.53
3 広島 493.04
4 鹿島 483.79
5 G大阪 448.67
6 C大阪 436.60
7 430.11
8 仙台 412.07
9 神戸 409.12
10 FC東京 402.80
11 横浜FM 363.06
12 札幌 361.31
13 鳥栖 358.20
14 磐田 339.88
15 清水 338.21
16 大宮 327.94
17 甲府 294.27
18 新潟 277.83
守備P
1 鹿島 1287.45
2 1271.90
3 甲府 1251.73
4 C大阪 1220.76
5 清水 1218.94
6 大宮 1216.59
7 札幌 1215.30
8 G大阪 1193.75
9 新潟 1176.42
10 川崎F 1171.67
11 広島 1171.59
12 浦和 1163.87
13 鳥栖 1151.46
14 仙台 1126.98
15 横浜FM 1126.40
16 FC東京 1090.20
17 神戸 1027.68
18 磐田 990.13
順位表
勝点試合得点得失
1 湘南 70 33 44 18
2 長崎 59 33 42 7
3 福岡 58 33 42 14
4 松本 55 33 52 21
5 横浜FC 53 33 47 13
6 名古屋 53 33 61 8
7 徳島 52 33 55 20
8 東京V 51 33 49 11
9 大分 51 33 44 4
10 岡山 49 33 38 2
11 千葉 47 33 51 2
12 山形 46 33 34 -5
13 水戸 45 33 36 0
14 町田 44 33 43 4
15 岐阜 43 33 45 0
16 愛媛 43 32 40 -7
17 京都 38 32 41 -1
18 金沢 33 33 33 -24
19 讃岐 31 33 36 -12
20 熊本 30 33 29 -15
21 山口 25 33 37 -20
22 群馬 18 33 22 -40
攻撃CBP
1 岐阜 821.31
2 名古屋 750.75
3 千葉 672.23
4 徳島 599.88
5 東京V 577.48
6 大分 565.68
7 湘南 544.67
8 福岡 541.89
9 山形 514.23
10 山口 504.29
11 松本 470.50
12 横浜FC 463.95
13 愛媛 463.44
14 京都 418.24
15 金沢 415.84
16 岡山 405.41
17 群馬 400.13
18 水戸 393.49
19 熊本 393.21
20 町田 390.74
21 讃岐 366.62
22 長崎 353.73
守備P
1 町田 1861.30
2 群馬 1810.87
3 山形 1775.21
4 岡山 1773.05
5 岐阜 1721.41
6 湘南 1720.92
7 徳島 1696.31
8 千葉 1689.82
9 金沢 1680.80
10 熊本 1677.93
11 松本 1669.82
12 東京V 1656.07
13 讃岐 1647.19
14 山口 1645.78
15 愛媛 1632.82
16 水戸 1630.20
17 大分 1616.69
18 福岡 1569.94
19 名古屋 1541.77
20 長崎 1523.43
21 横浜FC 1508.99
22 京都 1473.36
#footballlab
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(4)
Team Select close