第一線で活躍する役員が執筆する株式会社クヌギの公式メルマガです。SEOやマーケティングについての話を2ヶ月に1回配信しています。メルマガの購読は完全無料です。
最近の配信履歴
- 2024/3/29配信 【矢萩】3月のアップデートで評価される項目
- 2024/1/31配信 【矢萩】今年もSEOのチャンスが続く中、数か月受注停止します
- 2023/12/27配信 【新城】サイト全体よりも先に原稿一本のなかで「情報整理」してみる
- 2023/11/30配信 【矢萩】2023年のSEOを振り返って
機械学習の解釈性の低さと向かい合う
解釈性についてザックリ説明すると、機械学習を使って計算された結果は、アルゴリムズによっては線形回帰のようなわかりやすい計算式ではないため、結果にいたる過程を説明するのは難しいということです。
例えばデープラーニングは、解釈性が低い機械学習の1つですね。
Googleの検索結果も、複雑なアルゴリズムを利用しているため、外部リンク数やページ数などの説明変数だけで、順位にどれだけ影響を与えているのか、説明することが難しいと思います。
実際SEOでも、なぜその検索結果になっているか、そのすべてを誰も説明できないと言われてますね。
そして解釈性の低い結果に対し、機械学習ではPermutation Importanceなどの解釈手法を使って、結果を説明する方法があるのですが、SEOではそれらの手法を実施するのが難しいと考えてます。
なぜならば、例えば1のサイトが何点で1位なのか、2位のサイトが何点で2位なのかがわからないためです。
この何点がわからなければ、分析の精度は大きく下がってしまいます。
そのような状況下で検索結果を解釈する手法として、Googleの公表している評価基準をもとに、複数のシグナル(目的変数)を推測した上で、順位に大きく影響を与えている特徴量(説明変数)を、見つけ出す手法が有用だと考えてます。※シグナルを目的変数と捉えるという考え方です
ちなみにシグナルとはサイトを評価する1つの軸で、ページの表示スピードは、公開されている有名なシグナルの1つですね。
そしてページの表示スピードの場合は、公開されている説明変数として、FCPやLCPが存在しています。
このシグナルは、Googleが公開しているものと、非公開のものが存在しており、非公開のものについて、評価基準をもとにシグナルを推測して、分析するというのが僕の考え方です。