学生なのですが、変数名iを使うときはiが個人的にはindexの略と勝手に思っているためにrangeなどのループで使うイメージです。実際に実務で使うときはどーなんでしょう。このくらいの自動化であればそこまで気にしなくていいんでしょうか? 一つ目のfor文なら会社名の変数名をcompany_namesにして、for company_name in company names:〜にしてしまいそうです。 →変数名には基本的には意味を持たせろって習ったもので、少し違和感が。。。 (csvのインポートとデータの整形だけでpandasを使っていたので、とても参考になりました。)
メモリの大きさによるらしいです。Pandasが設定している制限はないそうです。そこまで大きなデータを扱ったことないので分かりませんが、Power Query M Languageよりも早く大量のデータをpandasなら処理できます。それぞれ数千行から数万行ある数個のExcel FileをSQLみたいに結合して出力する作業も数秒で終わります。
14:50 あたりのところでは画面上は(以下の3行目部分) シングルクオテーションが多めにかいてあったのですが、キノコードさんの音声でのご説明どおり以下のように記述すればうまくいきました(*´▽`*) for i in company_name: df_order_company = df_order[df_order['会社名'] == i] df_order_company.to_excel(export_file_path+i+'.xlsx') ←この行
df_orderを実行すると、NameError: name 'df_order' is not defined と出てきてしまいます。 ファイルのパスを入力するところがよくわからず、 ここが原因ではないかと考えてキノコードさんと同じ名前でデスクトップにダウンロードしたファイル置きましたがうまくいきません。解決方法を教えてください
非常に分かりやすい動画をありがとうございます。勉強になります。 質問なのですが、15:45のようにコマンドプロンプトでpythonを実行するときによく、 NameError: name 'get_ipython' is not defined というエラーが生じます。 いつも、エラーを回避するために、pythonファイルを編集して、get_ipythonを# でコメントアウトしてから、再度実行しています。 このようにいちいち編集することなく、エラーを防ぐ方法がございますでしょうか?
!pip install openpyxlを入力すると、 /bin/bash: pip: command not foundと返ってきます また、 import pandas as pdと入力すると、 ModuleNotFoundError: No module named 'pandas'と返ってきます 先週まで、普通にキノコードさんの動画でやっていたのですが、なぜでしょうか、、