OCNのブログサービス「ブログ人」が2014年11月30日で終了とのことです。
テキストデータのバックアップはツールあり
テキストデータは、ツールを使えばMovableType(MT)の形式(UTF-8/BOMなし)でダウンロード/バックアップすることができました。
WordPress(WP)への移行が目的でしたので、WP側でMT形式をインポートする「プラグイン」を追加し作業すれば、進行・完了です。ただし、万全ではありません。
テキストデータのうち絵文字をどうするか
ブログ人では絵文字をつかった入力ができます。しかし、それはWPでは正しく表示されない…。
DLしたテキストデータは、次のようなテキストに変換されていました。
[E:confident] [E:happy01] [E:wink]
長さ不定。先頭三文字と最後は決まった文字で、挟まれた文字は、a-zが何文字かならび、そのあとに二ケタの数字が並ぶ時と並ばないときがある…という条件のようです。
正規表現でブログ人の絵文字を検索/置換する
爺は正規表現得意でないです。これで正解かどうか自信はないですが、やってみたら成功した、ということでご理解を。
\[E:+[a-z]+[0-9]{0,2}+\]
TAKAががつて勉強した正規表現の教科書は「入門 正規表現 ~検索・置換・テキスト処理に強くなる!」というタイトルです。
つかったテキストエディタはMeryです。なので、ことなるエディタだと表現が違う場合があるかもしれません。そのあたりはご容赦を~。
検索して正確にヒットすれば、単に削除するか、なにか別の文字/記号をいれるかはできるかと思います。
画像、Word、PDFなどのダウンロード/バックアップ
「ブログ人」には画像、Word、PDFなどを一括してダウンロードできるツールは無いようです。ということで、無料ツールを見つけて、大部分をDLしました。
使ったツールは、GetHTMLWです。
GetHTMLWでは、画像とWordは無事DLできましたが、PDFは取得できませんでした。先にDLしたテキストデータ(記事データ)のなかから、「.pdf」を検索し、該当URLをコピーし引っ張り出すという手作業をおこないました~シクシク。でも、まあ、こんなものかと。画像を手作業でDLすることを考えると、まあ、くたばるほどの作業ではありませんでした。
なお、画像の種類がすべてOKなのかどうかについては未確認です。すみません。
Word、画像などのフォルダが別にできる
DLしたテキストデータのURLに沿ってフォルダがイロイロできます。画像関係はふたつありました。
これをWPに「uploads」フォルダ内にどう配置するかは、それぞれのお考えかと…。DLしたテキストデータのURL部分を移行先のフォルダ配置にあわせてURLを書き直す作業は、Meryの置換機能でおこないました。
画像関係を置換し、仮設サイトで確かめたらPDFがNGであることに気づき、あとでPDF関係のURLなども置換した、というのが耄碌爺の実際の作業でした。あ、Wordも…。