kakashi-blog・カカシブログ・

Python備忘録を書きドローンやバイクなど好きな事で生きて行こうとしているブログ

PC python プログラミング

Amazonのウェブスクレイピングが出来ない

投稿日:

 

pythonでプログラミングを勉強(というより趣味で遊んでいる)しています。

 

 

BeautifulSoupを使用して、ウェブスクレイピングがある程度出来るようになってきた。そこでAmazonサイトで商品名と価格を収集してまとめようとしました。

プログラムを走らせてみると、なんだかうまくデータが取れない。

たまにデータが取れるけど毎回は上手く動かない。たまに出来たりするので、バグを探すがどうもよくわからない・・・

もしやと思い取得したHTMLの一部を翻訳してみました。

なんと、スクレイピング禁止!

たぶん常識なんでしょうね。私は知りませんでした・・・

データが欲しいならAPIを使用しなくちゃならんという事でAmazonアソシエイトに登録しました。

 

他に方法はないの?

BeautifulSoupを使った方法はブロックされているので、他に方法はないのかと考えました。

人の手なら問題ない(当たり前ですが)、ならばSELENIUMならいけるんじゃ?

ブラウザをいちいち開くので時間はかかりますが、自動化は出来そう。

検索してページに飛んでは出来ましたのでおそらくいけるんじゃないかと思ってます。

機械的に100回とか繰り返したらブロックされるかもしれませんが、ランダムに時間の間隔を変化させて、ボタンクリックなどしていけばいけるかな。

ちょっとやってみます。

結果は次回の記事で。

-PC, python, プログラミング
-

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

PythonでFizzBuzz問題を書く

  FizzBuzz とは   元々は数人で遊ぶシンプルなゲーム。 1から順番にカウントアップして発言していき、3で割り切れる数のときは「Fizz」、5で割り切れる数の時は「Buzz]と発言していく。 …

Pythonプログラミング備忘録 ―エクセル操作編

pytohnプログラミング学習で勉強したことをまとめました 備忘録といった感じで、初心者向けに書いてあります   退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミ …

Python備忘録 selenium 自動ログイン編

前回はブラウザのスクロールまで行いました 今回はブラウザのログイン画面から自動ログインに挑戦   退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング   ◇ソー …

ノートパソコンにGPU(グラボ)を付けたい

  GTX1070とノートPCが余ってる マイニングを初めてから、デスクトップPCはほぼ放置状態 動かしておけばお金になるからね。 グラボの増設を考え、いろいろやったけど認識しないのであきらめました。 …

pythonで画像処理 Pillow(PIL)

画像処理なんて大げさですが、Pillow(PIL)を使用して少し画像の操作をやりました   ライブラリのインポート~ from PIL import Image im=Image.open(‘C:\\ …