生成AI時代において、単に「アクセス解析をする」だけでは
足りなくなりつつあります。
本当に重要になっているのは、
誰がデータを所有しているのか、どこまで構造を理解できるのか、
AIに自由に接続できるのか、という
「データ主権(Data Sovereignty)」の問題です。
従来、Web解析の中心はGoogle Analytics(GA)でした。しかし現在では、Cookie規制・広告ブロック・プライバシー保護の強化により、「ユーザー個人を追跡するモデル」そのものが揺らぎ始めています。
その中で注目されているのが、OSS型アクセス解析基盤であるPlausibleです。
Plausibleは単なる軽量アクセス解析ではありません。
むしろ、
PostgreSQLへ蓄積できる
Railsから自由に可視化できる
AIへ直接連携できる
データを自分で所有できる
という点で、「Inhouse AI(社内AI)」の前処理基盤になり得る構造を持っています。
前編では、Google Analytics・Search Console・Plausibleの違いを「誰を見ているのか?」という視点から整理しました。
後編ではさらに踏み込み、
なぜGAは大量PVが必要になるのか
なぜPlausibleは少量データでも機能するのか
PostgreSQLと組み合わせる意味
Railsによる自前分析基盤の可能性
Inhouse AI時代のデータ構造
まで、より実務的・構造的に考察していきます。
GA4は「個人追跡」だから大量PVが必要になる
Google Analytics 4(GA4)は非常に高機能です。
しかし、その高機能さは「個人単位で観測する」構造から生まれています。
GA4は基本的に、Cookie・セッション・イベント・ユーザーID
を組み合わせながら、「この人が何をしたか」を時系列で追跡します。
つまりGA4は、“人間を縦方向に観測するシステム”
と言えます。例えば:
1日目に記事Aを読む
2日目に記事Bを見る
3日目に商品ページを見る
これらを「同一人物」として接続し、分析するのがGA4です。
しかし問題は、この構造が非常にデータ量を必要とすることです。
例えば500PVあったとしても、
地域別
デバイス別
流入別
ページ別
に分解していくと、データは急激に薄まります。
さらに、
Cookie拒否
Adblock
同意バナー離脱
によって欠損が発生します。
つまりGA4の平均値は、「観測できた一部ユーザーの平均」
に過ぎないのです。この点は非常に重要です。
GA4は強力ですが、
低PVサイト
技術系ブログ
AI系ユーザー層
とは相性が悪い場合があります。
なぜならITリテラシーが高いユーザーほど、
Cookie拒否
広告ブロック
トラッキング回避
を行う傾向があるためです。
つまり、“高度なユーザーほどGAから消える”という逆説が起きます。
Search Consoleは「人」ではなく「検索現象」を見ている
Google Search Console(GSC)はGA4とは全く異なる思想で動いています。
GSCが見ているのは、
ユーザー個人
行動履歴
ではありません。
GSCが観測しているのは、「Google検索という巨大な現象」です。
例えば:
「AI ブログ」
「Rails PostgreSQL」
「Plausible」
などの検索が何回発生し、
何回表示され
何回クリックされたか
を集計しています。
ここではCookieは不要です。
なぜなら、データ源がブラウザではなくGoogle検索そのものだから
です。つまり:
システム 見ているもの
GA4 個人
GSC 検索現象
Plausible 集計イベント
という違いがあります。
ここで重要なのは、GSCはかなり「マクロ視点」であることです。
GA4が顕微鏡なら、
GSCは宇宙望遠鏡です。
サイト運営者に対して、
今どんな需要があるのか
どの検索語が伸びているのか
Googleが何を評価しているのか
を見せてくれます。
しかし同時に、GSCも完全にOpenではありません。なぜなら:
検索順位ロジック非公開
表示回数集計ロジック非公開
閾値処理あり
ロングテール省略あり
だからです。
つまりGSCは、「Googleが加工した検索世界の断面図」
に近い存在です。
Plausibleは「現象」を直接データ化している
Plausibleが面白いのは、
GA4のように「人」を追わず、
GSCのように「巨大検索世界」でもなく、
「サイト内で起きた現象」を直接集計している点です。
例えば:
今日の記事Aは100PV
Twitter経由が40%
検索流入が30%
滞在時間は平均2分
といった形で、
最初から集約済みデータとして扱います。
ここには、
個人識別
Cookie
長期追跡
がほぼありません。
つまりPlausibleは、「人間」ではなく「流れ」を見ているのです。
この構造には大きな利点があります。まず、少量データでも意味が出やすい。
GA4では500PV程度だと分析が不安定になりますが、Plausibleなら100PV程度
でも方向性が見えてきます。理由は単純で、最初から“平均化された世界”
を見ているからです。
さらに重要なのは、Plausibleはデータ所有権をユーザー側に
戻せる点です。
Plausibleは:
OSS
self-host可能
API提供
シンプル構造
という特徴があります。
つまり、
Plausible → PostgreSQL → Rails
という構造を自前で構築できるのです。
これは単なるアクセス解析ではありません。
むしろ:「自分専用のデータ観測基盤」
と言った方が正確です。
PostgreSQL+Railsが「Inhouse AI」の中心になる
ここからが本題です。
Plausibleの本当の価値は、
「画面UI」
ではありません。
本質は:データを自由に取り出せることです。
例えば:
Plausible API
Search Console API
から定期的にデータを取得し、
PostgreSQLへ蓄積する。
そしてRailsで:
SEOダッシュボード
検索順位変化
記事別成長率
リファラ分析
AI要約
自動レポート生成
などを実装していく。
これは既に、「解析ツール利用」ではなく「解析基盤構築」
です。
さらに生成AI時代では、この差が極めて大きくなります。
なぜならAIは、
ノイズが少ない
構造が単純
継続蓄積された
データを好むからです。
GA4のような複雑な個人追跡データは、
欠損
バイアス
ブラックボックス
を抱えやすい。
一方Plausible+PostgreSQL構造は、
「AI向けに整理しやすい観測データ」になりやすいのです。
つまり:
GSC → 外部需要
Plausible → 内部反応
PostgreSQL → 統合記憶
Rails → 可視化
AI → 解釈
という階層構造が成立します。
これは非常に重要です。
なぜなら今後のAI競争では、「どのモデルを使うか」よりも
「どんなデータを持っているか」の方が重要になる可能性が高いからです。
まとめ:「データを見る時代」から「データを所有する時代」へ
従来のWeb解析は、「Googleの画面を見る」ことが中心でした。
しかし生成AI時代では、それだけでは不十分になりつつあります。
本当に重要なのは:
データを保持する
自由に加工する
AIへ接続する
自分で意味づけする
ことです。
その意味で、
GA4
Search Console
Plausible
はそれぞれ異なる役割を持っています。
ツール 本質
GA4 人を追う
GSC 検索を見る
Plausible 現象を見る
そして、
Plausible+PostgreSQL+Rails
という構造は、
「ローカルAI時代の観測基盤」
として非常に興味深い位置にあります。
アクセス解析は、単なるPV計測ではなくなりつつあります。
それは今後、「AIのための感覚器官」へ変化していくのかもしれません。
〆最後に〆
以上、間違い・ご意見は
以下アドレスまでお願いします。
全て返信できていませんが 見ています。
適時、改定をします。
nowkouji226@gmail.com
【全体の纏め記事】に戻る
【思想の纏め記事】に戻る
