↑吉備津神社(記事とは関係ありませぬ)
VBAで記事タイトルを取得するスクリプトを書いています(≒ふりをしているとも…)。それで、記事見出し用にHTMLタグの何を使っているか、いくつか調べてみました。
これまでに、h1、h2はわかっていたのですが、h3,h4,li,div,pなども使われ、クラス名があったりなかったりでした。
こうなっては、簡単な条件判定で記事見出しを見つけることができそうもありません。また、固定ページを代表ページに設定しているWordPressサイトもあり、この場合どうするかも考えなければなりませぬ…シクシク。
管理しているWPなら、特定用クラス名を埋め込めば…
閲覧者の立場で、WPで構築したサイトの記事更新状況を取得するのであればRSSを利用するのが一番簡単そうです。しかし、先頭記事固定に対応しません。また、固定記事が代表ページになっている場合は別の考え方で記事見出しを拾わなければなりません。
そこで、反則技であります。WP管理者としての立場を使うとどうなるか…。
- WPで使うPHPに、記事更新を何らかのファイルとして残すよう、追加のPHPを機能するよう置く。でも今回はVBAですると決めたので、連携は面倒…(=ただスキル不足なだけ)
- テンプレートのHTMLを吐き出すPHPファイル内に、記事見出し用HTMLタグに共通するクラス名を埋め込む
どうやら、あとの方が楽そうです。VBAを書くとしても同じ条件(=クラス名)で記事見出しを特定できることになります。もちろん、CSSなどで影響があったりする可能性がありますので、クラス名は慎重に決めなければなりませんが…