【リメイク版#1】レース開催日一覧をスクレイピング【競馬AI開発】

  Рет қаралды 9,016

競馬予想で始めるデータ分析・機械学習

競馬予想で始めるデータ分析・機械学習

Күн бұрын

📘動画中のソースコードや補足解説はこちら↓
note.com/dijzpeb/n/n5f9ce2c05ec7
📘目次
0:00 はじめに
0:42 目指すこと
7:53 BeautifulSoupで開催日を取得
16:43 scrape_kaisai_date()の作成
28:58 開発しやすいソースコードのまとめ方
📘関連動画
競馬予想AIシリーズ第1回:Pythonで競馬データをスクレイピングする
• 【Python】スクレイピングを利用して競馬...
Pythonコードを自動修正!コードフォーマッターの導入方法・使い方
• 【開発・運用編#3】Pythonコードを自動...
競馬予想AIを作りたい初心者のための、参考書4選
• 【機械学習入門】競馬予想AIを作るのに必要な...
📘Twitter
@ejkaqfc
📘プロフィール
東京大学大学院(物理系) 卒業

WEBマーケティング調査会社のデータアナリスト

大手IT系事業会社のデータサイエンティスト

Пікірлер: 10
@user-ej3zj6kv9z
@user-ej3zj6kv9z 4 ай бұрын
📘動画中のソースコードや補足解説はこちら↓ note.com/dijzpeb/n/n5f9ce2c05ec7 📘目次 0:00 はじめに 0:42 目指すこと 7:53 BeautifulSoupで開催日を取得 16:43 scrape_kaisai_date()の作成 28:58 開発しやすいソースコードのまとめ方 📘関連動画 競馬予想AIシリーズ第1回:Pythonで競馬データをスクレイピングする kzbin.info/www/bejne/hquYgGhoqdibrLM Pythonコードを自動修正!コードフォーマッターの導入方法・使い方 kzbin.info/www/bejne/oIPJapdphtOInMk 競馬予想AIを作りたい初心者のための、参考書4選 kzbin.info/www/bejne/g4SmeKN8Z7tsq7c
@catpomu2816
@catpomu2816 4 ай бұрын
出走馬の全戦歴(4走や5走ではなく)の出馬表の作成方法を教えてほしいです。 しかし古馬になると数十を軽く超えるので例えば指定したレース数分の出馬表か一年間内の出馬表などの作成方法を紹介してほしいです。
@yukkuri-ds-lab
@yukkuri-ds-lab 3 ай бұрын
@catpomu2816 さん 投稿主ではなくて申し訳ないのですが、以下のようなやり方を参考にされるといいと思います 過去の成績をDataFrameの新規カラムとして追加する方法なら簡単な方法があります。 前提として、DataFrame形式で扱うことになりますので注意ください。それ以外のやり方は分からないです。 扱う変数データの前提を以下とします df: 全件レースデータのDataFrame - 持ってるカラム(抜粋) raceDate: 開催日 raceId: horseId: (以下は欲しい過去の戦歴情報とする; 好きなように読み替えてください。) field: 馬場 place: 競馬場 time: 走破タイム label: 着順 etc... コード例 # 事前にraceDateでデータをソートしておきましょう df.sort_values("raceDate").reset_index(drop=True, inplace=True) # 過去の成績が欲しいカラム一覧をリストで保持 target_lag_columns = ["field", "place", "time", "label"] # 直近何レースが欲しいか指定:ここでは過去10レースとする lagN = 10 # 本題である過去10レース分の戦績を新しいカラムとして追加する処理 for N in range(1, lagN+1): for col in target_lag_columns: df[f"{col}_lag{N}"] = df.groupby("horseId")[col].shift(N) # 過去10レース分のデータが新規カラムとして追加されているのが分かると思います print(df.column) 以上です。 キーワードは、groupby処理です。pandasのDataFrameは癖が強いためなるべくgroupbyを活用して特定のグループごとに処理すると処理時間の削減やコードの煩雑さの回避ができます。 参考になれば幸いです。
@user-np8zd4nn9z
@user-np8zd4nn9z 4 ай бұрын
書籍購入しました!メール送ったのでコミュニティ招待お願いいたします!
@sm.4299
@sm.4299 21 күн бұрын
競馬AIを作ってみたいと思い立ち,昨日Anacondaを入れてやってみようとしているのですが import pandas as pd pd.read_html(html)の初歩の初歩のところでインデックスエラーがでました. お手数ですがインストールされているライブラリ?をご教示願いたく存じます.
@user-ej3zj6kv9z
@user-ej3zj6kv9z 21 күн бұрын
beautifulsoup4==4.12.3 pandas==2.2.1 tqdm==4.66.1 です!
@sm.4299
@sm.4299 21 күн бұрын
@@user-ej3zj6kv9z 早速の返信ありがとうございます!頑張ってみます!困ったらまたコメントさせていただきます
@user-ej3zj6kv9z
@user-ej3zj6kv9z 21 күн бұрын
はい、是非!
@hiroshiaoyama1009
@hiroshiaoyama1009 4 ай бұрын
動画アップありがとうございます!とても参考になります。これからもがんばってください 自分は地方競馬のAI作成を作りたいのですが、中央と比べて憂慮する点はあるでしょうか?
@user-ej3zj6kv9z
@user-ej3zj6kv9z 4 ай бұрын
ありがとうございます! 久しぶりになってしまいましたが、ネタも溜まってきているので、動画作成頑張ります! > 地方競馬のAI作成を作りたいのですが、中央と比べて憂慮する点はあるでしょうか? → 地方競馬詳しくないので正直分からないのですが、あるとしたら、データが中央と同じくらいの量ちゃんと存在するか(開催頻度・馬の出走間隔など)や、同じような形式で取得できるのか、などの点はチェックが必要なのかなと思います
【リメイク版#2】ChromeDriverによるレースid一覧のスクレイピング【競馬AI開発】
40:09
競馬予想で始めるデータ分析・機械学習
Рет қаралды 4 М.
How To Connect Local LLMs to CrewAI [Ollama, Llama2, Mistral]
25:07
codewithbrandon
Рет қаралды 63 М.
КАРМАНЧИК 2 СЕЗОН 7 СЕРИЯ ФИНАЛ
21:37
Inter Production
Рет қаралды 547 М.
ChatGPTとCursorを覚えると、ビジネスマンがプログラミングまでできて、生産性が何十倍にもなる
12:02
池田朋弘のワーク実況_リモ研サブチャンネル
Рет қаралды 98 М.
Python RAG Tutorial (with Local LLMs): AI For Your PDFs
21:33
pixegami
Рет қаралды 150 М.
【永久保存版】データサイエンス入門完全攻略
1:15:57
はやたす | Python・データサイエンスコーチ
Рет қаралды 26 М.
VSCode終了…このAIエディタ、コード書くの楽すぎた【Cursor】
28:18
だれでもエンジニア / 山浦清透
Рет қаралды 114 М.
КРУТОЙ ТЕЛЕФОН
0:16
KINO KAIF
Рет қаралды 5 МЛН
Battery  low 🔋 🪫
0:10
dednahype
Рет қаралды 4 МЛН