「HTMLわかるよ」「Wordくらいつかえる」「PDF、ボタンクリックするだけでできる」というのが、ある程度PCに触っている方の反応でしょうね…。
HTMLとWord、そしてPDFは、とあるところで直線的につながっている。それは、ネットで利用するという一つの軸があるときに…、とここまで書いてわかる人には、以後のこの記事は不要です。
「は?」と思われた方には「見出し」「タイトル」というHTML、Word、PDFのそれぞれにつながる意味をお考えいただけたらと思いますし、「字が大きいからそれは見出し」という考え方を否定的にお伝えしてきたこれまでの爺のこのサイト内でのことを調べてみていただけたらとも思います。
PDFにテキスト要素が無く、テキストに見える画像だけある、という例があります。その上、プロパティ欄は空白…とか。このようなPDFにどういう意味があるか…。
また、HTMLの「title」、Word「表題」、そしてPDF「タイトル」が一直線につながるというようなことを書いて、ピンと感じていただけたら幸いです。
PDFのプロパティを拝見すると、タイトルや作成者の情報が無いという例は枚挙にいとまがありません。ネットで検索される情報となるためには、相応の価値づけされた文字情報が必要です。イロイロなテクニックがあるとしても、ともあれHTMLでいうところの「title」「h1」などがないと、如何にもと思います。まして、画像だけで構成され、文字情報がないPDFをどうやってネット上の情報として位置付けるのだろうかと疑問に思えることがある……。
これらを考える「軸」のようなモノが見えたら、Wordの保存をはじめ、PDFの作り方もおそらく「閲覧者センター」という視点で進行できる基礎が座るのだろうと想像します…。
PDFを拝見した時、使用言語、プロパティなどが明示されているときは、ちょっと安心します。逆に、このPDF、表に出ている人とは別の人が作っているらしいのが見えるんだけど、というときは残念にも思います。PDFで「しおり」などがキッチリできていると、その前段階も含め構造的な文書提供しようという作業が反映されているのだろうと、信頼を感じたりするものです。
さて…。