Python クローリング&スクレイピング Vol.6 – Wikipediaデータセットの頻出ワード解析

こんばんは!
T.R.Imaginationの北野です!

Python クローリング&スクレイピング
今回は第5章「クローリング・スクレイピングの実践とデータの活用」の中の

5.1 データセットの取得と活用

を読みました!

Wikipediaはデータセットを提供していて、スクレイピングしなくてもデータをダウンロードすることができます。

データが提供されている場合はそのデータを利用させていただき、スクレイピングをして対象のサイトに負荷をかけないようにしましょう!っていうお話が載ってました。

このデータセットを利用して、Wikipediaで頻出するキーワードを探ってみよう!的なサンプルコードが掲載されていました。

これは、ebayで売れてる商品の頻出キーワードを探ってみよう!
に応用できるんじゃないかと思ってます!

なかなか楽しいパートでした!

==========

メールマガジン配信してます!
是非読者登録してください!