Struccle free start now.try for free

3.Preparing URLs

入門ガイド

URLを準備する-

このガイドでは、使用するURLの準備及び便利機能について解説していきます。

目次

基本の考え方

①複数ページのURLを作る

ここでは複数ページのURLが存在していることを学び、複数ページのURL作成方法をご紹介します。

ページネーションとは

ウェブページなどのコンテンツを複数のページに分割し、各ページへのリンクを並べて表示する仕組みのことです。

上記赤丸の箇所のようなページがあるものが、複数ページ存在するページです。

この1ページ目のURLが

https://tabelog.com/kanagawa/A1404

となっており、2ページ目3ページ目以降は


https://tabelog.com/kanagawa/A1404/rstLst/2
https://tabelog.com/kanagawa/A1404/rstLst/3

と末尾の数字がページ数のページになっていきます。

つまり、手動でこの末尾を変えたURLを作れば、あなたの作りたい分のページURLを作成できます。
(Excel等で作成するとスムーズに作成できます)

このURLを取得URLとすればそのページ分のデータを全て取得することができます。

ページネーション機能

ただ、

これを全URL分作成をもっと簡単にしたい!

という方向けにページURLの自動作成機能も用意しています。

ページネーション機能の使い方

NEW CHATを押して新しいExtractorを開く

一覧ページのURL取ってきて、下記赤四角の箇所にURLを入れてSCRAPEを押す

PAGINATIONを選択

PAGINATION=複数URLページを自動生成

取得が完了したら下記のようになるので、MAKEを押す

CHECKをクリックする

上記のようになっているので、

Data format conversion:vertical
Column:pagination_url

を選択することによって

上記のようにデータをバラすことができました。

ここの右の箇所のURLが正しく全て取れているかを確認します

ここでもし正しくない(URLが順番になっていない等)があればひとつページを戻り
赤丸のPromptの箇所に修正してもらいたい内容を入力してSCRAPEを押す。


こうするとAIがデータを修正してくれます

こうしてデータが完成したら名前をつけて保存。
これでこのデータはページネーションパーサーとして使用できます。


それでは次にSTEP.3の

URLを準備する

を学んでいきましょう!


目次