当時と仕様が変わっているので、 from urllib.request import urlopen url = "db.netkeiba.com/race/201901010101" html = urlopen(url).read() pd.read_html(html)[0] を実行してみてください!
@あさ-m2y Жыл бұрын
面白いチャンネルですね 個人的にめっちゃ好きです
@競馬予想で始めるデータ分析3 жыл бұрын
【重要な変更点】 ・race_idが存在しないページについても読み込み自体は行われているので、time.sleep(1)はfor文の先頭に書くようにしてください! ・当時と仕様が変わっていて、pd.read_html(url)がUnicodeDecodeErrorとなる場合があるので、その場合は、 from urllib.request import urlopen url = "db.netkeiba.com/race/201901010101" html = urlopen(url).read() pd.read_html(html)[0] で実行してください
@so161554 жыл бұрын
現在スクレイピング中! わかりやすい動画ですね!!
@チャンネルアイサム2 жыл бұрын
race_results[race_id] = pd.read_html(url)[0] test = scrape_race_results(race_id_list) の部分にlist indices must be integers or slices, not strとエラーが出てしまいます。 自分なりに調べ上げたのですが改善されません。 どう対処していけば改善されますか? よろしくお願いします。
こんにちは。zennにて完全版を購入させてもらいました!これから学び狂いたいと思います! 早速質問なのですが、第1回の動画とともに公開されているソースコードを丸々コピペして実行したところ、以下のエラーが表示され、うまく情報取得が開始されませんでした。この場合、どのように対処すべきでしょうか?? ---------------------------------------------------------------------------------------------------- time.sleep(1) ^ TabError: inconsistent use of tabs and spaces in indentation ----------------------------------------------------------------------------------------------------
勉強させてもらってます! 電子書籍も買わせていただいて、コードを参考にスクレイピングを試みたところ下記エラーが出ました。 TypeError: list indices must be integers or slices, not tuple 特にいじらずまずはコピペしてみたのですが、この場合どこがエラーになっているのでしょうか?
初めまして。非常に分かりやすい動画ありがとうございます。 自己解決できない部分があったため質問させていただきます。 tqdmで進捗状況を表示させるプロセスの部分でtest=scrape_race_results(race_id_list)を実行するとプログレスバーが表示されない上、Index error: list index out of range という表示が出てしまい進めません。何が原因でしょうか。。。 ご回答いただけると助かります!!!
@競馬予想で始めるデータ分析3 жыл бұрын
tqdmのインポートの仕方が変わっているので、 zenn.dev/dijzpeb/books/848d4d8e47001193f3fb/viewer/471b66 を参考にインポートし直してみてください! Index error: list index out of range がどの部分で起こっているかによるのですが、race_id_listが空になっていたりしませんか?
古い動画にコメント頂きありがとうございます。 行数数が少ないです。 動画内ですと3356行なのが、私の方では3188行になってしまいます。 動画内で、インデックスの最後(29:51)は201910021012に対し、私の方では、201910020812となっております。 原因追求のためソースコードを見返してみると、dayのfor文の回数が1-9まで、つまり1-8日目までとなっていると思います。(11:28付近) また、netkeibaページを見てみると、小倉競馬場などで開催日数が12日まであります。 したがって、動画内のソースコードでは、全てが網羅できていないかと思います。 また、動画内の最後のインデックス201910021012、この番号は取得できないと思うのですが、認識は合ってますでしょうか。 もし、この認識が合っているのであれば、 for day in range(1,13,1)となると考えております。 こちらのページも参考にしております。 www.jra.go.jp/datafile/seiseki/report/2019.html#pdf_sapporo