北海道コンサドーレ札幌ベガルタ仙台鹿島アントラーズ浦和レッズ大宮アルディージャ柏レイソルFC東京川崎フロンターレ横浜F・マリノスヴァンフォーレ甲府アルビレックス新潟清水エスパルスジュビロ磐田ガンバ大阪セレッソ大阪ヴィッセル神戸サンフレッチェ広島サガン鳥栖
モンテディオ山形水戸ホーリーホックザスパクサツ群馬ジェフユナイテッド千葉東京ヴェルディFC町田ゼルビア横浜FC湘南ベルマーレ松本山雅FCツエーゲン金沢名古屋グランパスFC岐阜京都サンガF.C.ファジアーノ岡山レノファ山口FCカマタマーレ讃岐徳島ヴォルティス愛媛FCアビスパ福岡V・ファーレン長崎ロアッソ熊本大分トリニータ
グルージャ盛岡ブラウブリッツ秋田福島ユナイテッドFC栃木SCY.S.C.C.横浜SC相模原AC長野パルセイロカターレ富山藤枝MYFCアスルクラロ沼津ガイナーレ鳥取ギラヴァンツ北九州鹿児島ユナイテッドFCFC琉球FC東京U−23ガンバ大阪U−23セレッソ大阪U−23
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1)
RSS
Column
2017 2/23 [Thu.]

2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1)

富士ゼロックススーパーカップが終わり、いよいよ2/25から明治安田生命J1リーグが開幕する。

本稿では、データスタジアムが保有する、2016年のJ1リーグ全出場選手の試合ごとのスタッツデータ※401項目を、機械学習手法を駆使して解析、各チームの勝敗予測モデルを作成することによって、2017年のJ1リーグの展望をデータから予測してみる。

※ここでのスタッツデータとは、選手の走行距離やスプリント回数といったトラッキングデータと、インターセプト、パスやシュート、ドリブルの回数といったプレーデータを指す。

 

サッカーの勝敗予測はどのように行えばよいだろうか。サッカーは、ゴールが対戦相手よりも多いチームが勝利するスポーツだ。サッカーにおけるゴール数は、野球やバスケットボールなど他のスポーツと比較し、一般的に少ない。2016J1リーグでは805ゴールが生まれたが、1試合における、各チームのゴール数は平均1.3ゴールであった。また、1試合における両チームあわせたゴール数が3ゴール以内だった試合は全体の71.6%となった。

さてこのような滅多に起きない事象は、ポワソン分布と呼ばれる確率分布に従うことが知られている。ポワソン分布とは、いわゆる左右対称の正規分布ではなく、01といった小さい値となる確率が大きい確率分布となり、事象の平均値から求められる。


2016J1リーグ全試合における実際の各チームのゴール数の分布(青い棒グラフ)と、平均値1.32016J1リーグの1試合あたりの平均ゴール数)に従うポワソン分布(赤い棒グラフ)は下記の通りとなる。

横軸:ゴール数、縦軸:頻度(各ゴールとなった試合数)

 

たしかにJ1リーグのゴール数の確率分布は、ポワソン分布で近似できそうだ。各チームの1試合平均ゴール数を用いれば、チームごとのゴール数を確率的に予測することができる。たとえば、川崎フロンターレ(1試合平均ゴール数:2.0)と浦和レッズ(1試合平均ゴール数:1.7)におけるポワソン分布に従うゴール数ごとの確率は下記の通りとなる。

横軸:ゴール数、縦軸:発生確率

青の棒グラフ:川崎フロンターレのゴール数の確率分布

赤の棒グラフ:浦和レッズのゴール数の確率分布

 

ゴール数が多いチームが勝ちとなるので、両者のゴール数確率を比較することで、勝敗を予測することができる。たとえば、上記のポワソン分布からの勝敗確率は下記の通りとなる。

 

川崎フロンターレ勝利:43.7%

引き分け:34.7%

浦和レッズ勝利:21.6%

 

これがもっともシンプルなモデルだが、精度向上のために、いくつかの重要なことを考慮しなければならない。サッカーはゴールが対戦相手よりも上回ればよい。すなわち、多くのゴールを目指すのではなく、まずは対戦相手にゴールさせず、少ないゴールで勝利する、堅守をベースにしたチームがある(得失点があるのでゴールが多いことにこしたことはないが)。また、ゴール数は対戦相手によって異なることが予想され、上位チーム、下位チームとの対戦では期待されるゴール数は異なると思われる。

 

そこで、試合ごとに、自チームおよび対戦相手チームの様々なスタッツデータとゴール数を機械学習し、異なる相手によって異なる平均ゴール数の期待値を予測し、その値を用いてポワソン分布からのゴール数確率分布を比較することが考えられる。

 

STEP.1: 試合ごとの自チーム・対戦チームのスタッツデータとゴール数の関係を機械学習

STEP.2: STEP.1のモデルを用いて、予想したい自チーム・対戦チーム(のスタッツデータ)から(平均)ゴール数を予測

STEP.3: STEP.2の平均ゴール数からポワソン分布によって、ゴール数を確率的に予測し、両チームで比較、勝敗予測とする。

STEP.2のゴール数自体を比較して勝敗予測としていないのは、確率としての幅をもたせるため。

※ポワソン分布を、対戦チームごとにもとめるアプローチも考えられるが、スタッツデータを機械学習

 することで、選手の移籍などで自チーム・対戦チームのパラメータが変化した際にも対応できるモデル

 とした。(今オフは主力選手の移籍はホットトピックである※詳細後述)


「2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(2)」に続く

このページをツイートして、フォロワーに広めよう!
Archive
コンサドーレ札幌, ベガルタ仙台, 鹿島アントラーズ, 浦和レッズ, 大宮アルディージャ, 柏レイソル, FC東京, 川崎フロンターレ, 横浜Fマリノス, ヴァンフォーレ甲府, アルビレックス新潟, 清水エスパルス, ジュビロ磐田, ガンバ大阪, セレッソ大阪, ヴィッセル神戸, サンフレッチェ広島, サガン鳥栖, モンテディオ山形, 水戸ホーリーホック, ザスパクサツ群馬, ジェフユナイテッド千葉, 東京ヴェルディ, FC町田ゼルビア, 横浜FC, 湘南ベルマーレ, 松本山雅FC, ツエーゲン金沢, 名古屋グランパス, FC岐阜, 京都サンガF.C., ファジアーノ岡山, レノファ山口, カマタマーレ讃岐, 徳島ヴォルティス, 愛媛FC, アビスパ福岡, V・ファーレン長崎, ロアッソ熊本, 大分トリニータ, J1, J2, J3, 日本代表, 五輪代表, ルヴァンカップ, ワールドカップ, レビュー, プレビュー, ACL, ベストイレブン, グルージャ盛岡, ブラウブリッツ秋田, 福島ユナイテッドFC, 栃木SC, Y.S.C.C.横浜, SC相模原, AC長野パルセイロ, カターレ富山, 藤枝MYFC, アスルクラロ沼津, ガイナーレ鳥取, ギラヴァンツ北九州, 鹿児島ユナイテッドFC, FC琉球, Jリーグ・アンダー22選抜, FC東京U-23, ガンバ大阪U-23, セレッソ大阪U-23, ロンドン五輪, 海外日本人選手, トラッキングデータ, 選手指標開発
Jリーグスタジアム
PICK UPmore
2017 8/8 [Tue.] 新開発の「チームスタイル指標」が示す、今Jリーグで見ておくべきチームとは。 今季のJリーグでは、“ハイプレス&ハイライン”戦術で評判となったフアン エスナイデル監督が率いるジェフユナイテッド千葉や、ポゼッションサッカーを信条とする大木 武監督が就任して改革が進むFC岐阜などが面白いサッカーをするチームとして話題に上ることが多い。また、Jリーグを日常的に追い掛けているあなたは、Jリーグをあまり見ない友人にこんな質問をされた経験があるかもしれない。「今、どのチームの試合を見に行けばいい?」「どのチームのサッカーが面白い?」と。データスタジアムが運営するFootball LABでは、当社で取得しているプレーデータとトラッキングデータ(J1のみ)を組み合わせた解析により、これまで定性的に語られていたチームのプレースタイルを可視化することを目的として「チームスタイル指標」を開発。簡単に説明をすると、全試合のプレーデータからいくつかの種類に攻撃パターンを分類し、それぞれのパターンにおける攻撃の試行回数を素にしたリーグ内での偏差値をはじき出している。トラッキングデータを取得しているJ1では、各シチュエーションにおける走行距離やポジショニングから、攻守の切り替えや守備陣形といった守備データを扱うことも可能となった。「チームスタイル指標」における各項目の詳細な説明は割愛するが、どんな項目があり、その項目はどういったプレーを指すのか。気になるあなたは、『チームスタイル指標とは』のページをご覧いただきたい。
2017 7/14 [Fri.] 終盤の失点が大幅に減少。躍進するセレッソ大阪
2017 6/2 [Fri.] 勝ち抜くためには縦ポン推奨? ~J3というカテゴリー~
Column more
2017 8/8 [Tue.] 新開発の「チームスタイル指標」が示す、今Jリーグで見ておくべきチームとは。 今季のJリーグでは、“ハイプレス&ハイライン”戦術で評判となったフアン エスナイデル監督が率いるジェフユナイテッド千葉や、ポゼッションサッカーを信条とする大木 武監督が就任して改革が進むFC岐阜などが面白いサッカーをするチームとして話題に上ることが多い。また、Jリーグを日常的に追い掛けているあなたは、Jリーグをあまり見ない友人にこんな質問をされた経験があるかもしれない。「今、どのチームの試合を見に行けばいい?」「どのチームのサッカーが面白い?」と。データスタジアムが運営するFootball LABでは、当社で取得しているプレーデータとトラッキングデータ(J1のみ)を組み合わせた解析により、これまで定性的に語られていたチームのプレースタイルを可視化することを目的として「チームスタイル指標」を開発。簡単に説明をすると、全試合のプレーデータからいくつかの種類に攻撃パターンを分類し、それぞれのパターンにおける攻撃の試行回数を素にしたリーグ内での偏差値をはじき出している。トラッキングデータを取得しているJ1では、各シチュエーションにおける走行距離やポジショニングから、攻守の切り替えや守備陣形といった守備データを扱うことも可能となった。「チームスタイル指標」における各項目の詳細な説明は割愛するが、どんな項目があり、その項目はどういったプレーを指すのか。気になるあなたは、『チームスタイル指標とは』のページをご覧いただきたい。
2017 7/14 [Fri.] 終盤の失点が大幅に減少。躍進するセレッソ大阪
2017 6/2 [Fri.] 勝ち抜くためには縦ポン推奨? ~J3というカテゴリー~
順位表
勝点試合得点得失
1 鹿島 64 29 48 21
2 川崎F 59 29 59 29
3 53 29 44 14
4 横浜FM 52 29 37 11
5 C大阪 51 29 54 15
6 磐田 50 29 44 18
7 浦和 45 29 60 12
8 神戸 41 29 33 0
9 鳥栖 41 29 35 -1
10 G大阪 40 29 44 9
11 FC東京 38 29 34 -2
12 仙台 35 29 38 -11
13 札幌 31 29 30 -12
14 清水 29 29 31 -17
15 甲府 28 29 20 -13
16 広島 27 29 28 -14
17 大宮 23 29 26 -23
18 新潟 15 29 20 -36
攻撃CBP
1 川崎F 662.11
2 浦和 622.75
3 鹿島 539.51
4 広島 530.63
5 G大阪 492.83
6 C大阪 491.11
7 487.14
8 仙台 465.87
9 神戸 461.24
10 FC東京 452.56
11 横浜FM 417.60
12 札幌 399.90
13 鳥栖 389.66
14 清水 382.97
15 磐田 377.99
16 大宮 361.88
17 甲府 320.04
18 新潟 317.67
守備P
1 鹿島 1425.33
2 1419.23
3 甲府 1377.19
4 C大阪 1369.25
5 札幌 1368.79
6 新潟 1356.03
7 大宮 1351.09
8 清水 1335.26
9 広島 1324.19
10 浦和 1320.52
11 G大阪 1313.89
12 川崎F 1313.39
13 鳥栖 1277.67
14 仙台 1258.62
15 FC東京 1221.71
16 横浜FM 1218.05
17 神戸 1175.12
18 磐田 1108.86
順位表
勝点試合得点得失
1 湘南 77 37 53 22
2 福岡 68 37 50 18
3 長崎 67 37 47 9
4 名古屋 65 37 77 18
5 松本 61 37 57 18
6 徳島 60 37 63 25
7 東京V 60 37 58 13
8 横浜FC 57 37 52 10
9 大分 57 37 52 7
10 千葉 53 37 60 5
11 水戸 51 37 41 1
12 山形 50 37 37 -6
13 岡山 49 37 39 -5
14 京都 48 36 49 6
15 町田 47 37 48 2
16 愛媛 46 36 46 -11
17 岐阜 44 37 51 -7
18 金沢 38 37 41 -23
19 熊本 36 37 33 -15
20 讃岐 35 37 38 -16
21 山口 28 37 43 -23
22 群馬 19 37 25 -48
攻撃CBP
1 岐阜 934.00
2 名古屋 850.04
3 千葉 736.33
4 徳島 675.75
5 大分 645.60
6 東京V 643.33
7 湘南 612.50
8 福岡 602.21
9 山形 587.79
10 山口 553.33
11 愛媛 540.92
12 横浜FC 538.84
13 松本 514.32
14 京都 482.15
15 金沢 472.92
16 岡山 467.77
17 熊本 455.44
18 群馬 454.90
19 水戸 452.77
20 町田 447.32
21 讃岐 417.95
22 長崎 398.84
守備P
1 町田 2078.75
2 群馬 1996.39
3 山形 1967.31
4 岡山 1962.55
5 湘南 1931.58
6 徳島 1922.23
7 岐阜 1916.21
8 熊本 1906.19
9 金沢 1894.94
10 松本 1883.71
11 水戸 1868.15
12 千葉 1862.60
13 山口 1849.40
14 東京V 1845.60
15 愛媛 1844.36
16 讃岐 1834.74
17 大分 1788.30
18 福岡 1739.20
19 名古屋 1729.31
20 横浜FC 1718.81
21 京都 1703.83
22 長崎 1693.95
#footballlab
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1)
Team Select close