ITで遊ぶ

Googleの検索結果をスプレッドシートに抜く方法

*この記事は2016年のものです。今のGoogle SpreadSheetで試しましたがGoogleの検索結果に限り処理されないようです。

このようなことは、かつてはExcelからIEをActive Xとして呼び出してデータを受け取る方法が主流だったし、ネットにはその方法が大量に載っている。

しかし、もはや古い手法となった。

なぜならば、Windows 10だかでIEはEdgeと名前を変え、まったく新しくなってしまった。
(使いづらさはいやがらせのように相変わらず続いているが)

そこで出て来るのがGoogle SpreadSheet。

これだとバカみたいに簡単だ。

spreadsheet

A欄が検索キーワード

B欄にGoogleの検索用URLを生成

C欄にリンクを抜く

 

B欄には次のようにセット

=“http://www.google.co.jp/search?hl=jp&gl=JP&q=”&A2

C欄には次のようにセット

=IMPORTXML(B2,“//a/@href”)

IMPORTXMLが鍵。これはURLで得たデータをXMLだとしてXPATHでフィルタリングする。
そのページ内にあるリンクはすべて抽出される。 
あとは抽出したリンクをエクセルなりにコピペして作業すればよい。
注意:会社のオフィスなどでファイアーウォールいれてポートを絞っている環境だと、うまくURL検索されないことがあります。ご注意を。

 

 

関連記事

  1. ソフトウェアは進歩し続けなけりゃならんのか?

  2. 小学生にプログラミング?言ってるおまえ、プログラム書けないだろ

  3. Linux Kernel Map

  4. Tkinterにおけるタイマー処理、ボタン処理

  5. python 正規表現で文字列判定

  6. Mac環境でPHP使ってウェブアプリの開発

  7. DBの正規化

  8. Windowsパソコンの買い替え/アップデート