ITで遊ぶ

Googleの検索結果をスプレッドシートに抜く方法

*この記事は2016年のものです。今のGoogle SpreadSheetで試しましたがGoogleの検索結果に限り処理されないようです。

このようなことは、かつてはExcelからIEをActive Xとして呼び出してデータを受け取る方法が主流だったし、ネットにはその方法が大量に載っている。

しかし、もはや古い手法となった。

なぜならば、Windows 10だかでIEはEdgeと名前を変え、まったく新しくなってしまった。
(使いづらさはいやがらせのように相変わらず続いているが)

そこで出て来るのがGoogle SpreadSheet。

これだとバカみたいに簡単だ。

spreadsheet

A欄が検索キーワード

B欄にGoogleの検索用URLを生成

C欄にリンクを抜く

 

B欄には次のようにセット

=“http://www.google.co.jp/search?hl=jp&gl=JP&q=”&A2

C欄には次のようにセット

=IMPORTXML(B2,“//a/@href”)

IMPORTXMLが鍵。これはURLで得たデータをXMLだとしてXPATHでフィルタリングする。
そのページ内にあるリンクはすべて抽出される。 
あとは抽出したリンクをエクセルなりにコピペして作業すればよい。
注意:会社のオフィスなどでファイアーウォールいれてポートを絞っている環境だと、うまくURL検索されないことがあります。ご注意を。

 

 

関連記事

  1. Tkinterにおけるタイマー処理、ボタン処理

  2. 静的HTMLに他HTMLを読み込む方法

  3. CakePHP(2)

  4. 個人システム開発の未来

  5. 思想をあらわすプログラミング

  6. Com0Com 64bit版使うよりも

  7. 暗号は再び戦いとなる

  8. PIC16F1705