初心者みけねこの趣味のPython

Python3について書いていきます

退屈なことはPythonにやらせよう 14章 Webスクレイピング について

 タイトルの本の14章のWebスクレイピングのところで、いくつか不具合とか追加情報などがあったので書きます。

11.5 プロジェクト:Google検索"I'm Feeling Lucky"
 本に記載されている内容と現在のGoogleの仕様が異なっているようで、Googleで検索した結果をブラウザの複数のタブに表示はできません。色々と試してみたのですがだめでした。

11.7 seleniumモジュールを用いてブラウザを制御する
 本ではブラウザにFirefoxを使っていますが、俺はGoogle Chromeをメインで使っているので、Chromeでのやり方を書きます。

 まず、P289の真ん中よりちょっと下に
>>> browser = webdriver.Firefox()
とありますが、以下の方法でChromeでもできます。
 まず、
https://chromedriver.storage.googleapis.com/index.html?path=2.30/
で、自分の環境にあったzipファイルをダウンロードして、展開します。俺はWindows10で64bitのChromeを使っていますが、
chromedriver_win32.zip でうまくいきました。展開すると"chromedriver.exe"があるので、このファイルをパスが通ったフォルダにコピーします。
 次に
>>> browser = webdriver.Chrome()
と変えてやればChromeが使えます。

11.7.4のフォームを記入して送信する ですが、yahooの仕様が変わっているようで、どうやってもだめでした。

 と、簡単にですが、この章の2か所は実際に試すことはできなかったです。