ITで遊ぶ

Googleの検索結果をスプレッドシートに抜く方法

*この記事は2016年のものです。今のGoogle SpreadSheetで試しましたがGoogleの検索結果に限り処理されないようです。

このようなことは、かつてはExcelからIEをActive Xとして呼び出してデータを受け取る方法が主流だったし、ネットにはその方法が大量に載っている。

しかし、もはや古い手法となった。

なぜならば、Windows 10だかでIEはEdgeと名前を変え、まったく新しくなってしまった。
(使いづらさはいやがらせのように相変わらず続いているが)

そこで出て来るのがGoogle SpreadSheet。

これだとバカみたいに簡単だ。

spreadsheet

A欄が検索キーワード

B欄にGoogleの検索用URLを生成

C欄にリンクを抜く

 

B欄には次のようにセット

=“http://www.google.co.jp/search?hl=jp&gl=JP&q=”&A2

C欄には次のようにセット

=IMPORTXML(B2,“//a/@href”)

IMPORTXMLが鍵。これはURLで得たデータをXMLだとしてXPATHでフィルタリングする。
そのページ内にあるリンクはすべて抽出される。 
あとは抽出したリンクをエクセルなりにコピペして作業すればよい。
注意:会社のオフィスなどでファイアーウォールいれてポートを絞っている環境だと、うまくURL検索されないことがあります。ご注意を。

 

 

関連記事

  1. 一人でアプリケーションを開発する時のサーバーレス

  2. Visual Basic 2017 vs. Microsoft Acc…

  3. Web Serial API

  4. 小学生にプログラミング?言ってるおまえ、プログラム書けないだろ

  5. ソフトウェアは進歩し続けなけりゃならんのか?

  6. JQM テンプレートhtml

  7. Linux Kernel Map

  8. WooCommerceからB2Webへ(2)