ITで遊ぶ

Googleの検索結果をスプレッドシートに抜く方法

*この記事は2016年のものです。今のGoogle SpreadSheetで試しましたがGoogleの検索結果に限り処理されないようです。

このようなことは、かつてはExcelからIEをActive Xとして呼び出してデータを受け取る方法が主流だったし、ネットにはその方法が大量に載っている。

しかし、もはや古い手法となった。

なぜならば、Windows 10だかでIEはEdgeと名前を変え、まったく新しくなってしまった。
(使いづらさはいやがらせのように相変わらず続いているが)

そこで出て来るのがGoogle SpreadSheet。

これだとバカみたいに簡単だ。

spreadsheet

A欄が検索キーワード

B欄にGoogleの検索用URLを生成

C欄にリンクを抜く

 

B欄には次のようにセット

=“http://www.google.co.jp/search?hl=jp&gl=JP&q=”&A2

C欄には次のようにセット

=IMPORTXML(B2,“//a/@href”)

IMPORTXMLが鍵。これはURLで得たデータをXMLだとしてXPATHでフィルタリングする。
そのページ内にあるリンクはすべて抽出される。 
あとは抽出したリンクをエクセルなりにコピペして作業すればよい。
注意:会社のオフィスなどでファイアーウォールいれてポートを絞っている環境だと、うまくURL検索されないことがあります。ご注意を。

 

 

関連記事

  1. Windowsパソコンの買い替え/アップデート

  2. 汎用プログラムPythonとeasygui(1)

  3. カラーミーAPIを使う(発送データ作成)

  4. Perl定石

  5. 静的HTMLに他HTMLを読み込む方法

  6. Visual Studio 2017 Visual Basic データ…

  7. JavaScriptグラフィック(2)

  8. Windowsスクリプト

記事をプリント