kakashi-blog・カカシブログ・

Python備忘録を書きドローンやバイクなど好きな事で生きて行こうとしているブログ

PC python プログラミング

Amazonのウェブスクレイピングが出来ない

投稿日:

 

pythonでプログラミングを勉強(というより趣味で遊んでいる)しています。

 

 

BeautifulSoupを使用して、ウェブスクレイピングがある程度出来るようになってきた。そこでAmazonサイトで商品名と価格を収集してまとめようとしました。

プログラムを走らせてみると、なんだかうまくデータが取れない。

たまにデータが取れるけど毎回は上手く動かない。たまに出来たりするので、バグを探すがどうもよくわからない・・・

もしやと思い取得したHTMLの一部を翻訳してみました。

なんと、スクレイピング禁止!

たぶん常識なんでしょうね。私は知りませんでした・・・

データが欲しいならAPIを使用しなくちゃならんという事でAmazonアソシエイトに登録しました。

 

他に方法はないの?

BeautifulSoupを使った方法はブロックされているので、他に方法はないのかと考えました。

人の手なら問題ない(当たり前ですが)、ならばSELENIUMならいけるんじゃ?

ブラウザをいちいち開くので時間はかかりますが、自動化は出来そう。

検索してページに飛んでは出来ましたのでおそらくいけるんじゃないかと思ってます。

機械的に100回とか繰り返したらブロックされるかもしれませんが、ランダムに時間の間隔を変化させて、ボタンクリックなどしていけばいけるかな。

ちょっとやってみます。

結果は次回の記事で。

-PC, python, プログラミング
-

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

Python備忘録 Tkinter編① 

Tkinterとは キーボード操作だけでなく、 マウスを使用した操作が可能なウィンドウやボタン、入力欄など GUI を比較的簡単に 作る事が出来るライブラリ   退屈なことはPythonにやらせよう …

ナイスハッシュのmining payment毎に、レートを自動で取得(python)

マイニングを始めると、どのタイミングのレートで確定申告しようかと考えると思います。 ググると結構皆さん独自で考えて行っているのが現状ですかね。 ひと月にまとめている人、円に換えたタイミングの人・・・結 …

CPUの選び方、Intel&AMDの性能と価格、レシオでコスパを判断

自作PCを作ってみようと思い立ったが、どのCPUを選べばいいかわからない。 なので、一つの判断材料として性能&価格でレシオを比較してみよう    PC自作の鉄則! 2020 (日経BPパソコンベストム …

子供がズルをするので計算カードをpython(Tkinter)で作った

うちの小学1年生の子の宿題に「計算カード」があります。 学校からは、「時間を計ってやりなさい」と言われているようです。 もちろん計算なんかせず、めくる事が目的になって、 どれだけ早くめくれるか。みたい …

Windowsキーボード入力、便利なショートカット(仮想デスクトップなど)

仮想デスクトップのショートカットを最近知りましたこんなに便利な機能があるのに、職場で使っている人を見たことなかったそもそも人のPC操作ってあまり見る機会ないですね        ①仮想デスクトップの作 …