Googleの検索結果をスプレッドシートに抜く方法

プログラミング

*この記事は2016年のものです。今のGoogle SpreadSheetで試しましたがGoogleの検索結果に限り処理されないようです。

このようなことは、かつてはExcelからIEをActive Xとして呼び出してデータを受け取る方法が主流だったし、ネットにはその方法が大量に載っている。

しかし、もはや古い手法となった。

なぜならば、Windows 10だかでIEはEdgeと名前を変え、まったく新しくなってしまった。
(使いづらさはいやがらせのように相変わらず続いているが)

そこで出て来るのがGoogle SpreadSheet。

これだとバカみたいに簡単だ。

spreadsheet

A欄が検索キーワード

B欄にGoogleの検索用URLを生成

C欄にリンクを抜く

 

B欄には次のようにセット

=“http://www.google.co.jp/search?hl=jp&gl=JP&q=”&A2

C欄には次のようにセット

=IMPORTXML(B2,“//a/@href”)

IMPORTXMLが鍵。これはURLで得たデータをXMLだとしてXPATHでフィルタリングする。
そのページ内にあるリンクはすべて抽出される。 
あとは抽出したリンクをエクセルなりにコピペして作業すればよい。
注意:会社のオフィスなどでファイアーウォールいれてポートを絞っている環境だと、うまくURL検索されないことがあります。ご注意を。

 

 

コメント