pagetaka

写真、PC、ネット、岡山、旅の話題をお届けします

OCNブログ人11月30日終了:データの引っ越し

OCNのブログサービス「ブログ人」が2014年11月30日で終了とのことです。
ocnブログ人サービス終了

テキストデータのバックアップはツールあり

テキストデータは、ツールを使えばMovableType(MT)の形式(UTF-8/BOMなし)でダウンロード/バックアップすることができました。
WordPress(WP)への移行が目的でしたので、WP側でMT形式をインポートする「プラグイン」を追加し作業すれば、進行・完了です。ただし、万全ではありません。

テキストデータのうち絵文字をどうするか

ブログ人では絵文字をつかった入力ができます。しかし、それはWPでは正しく表示されない…。
DLしたテキストデータは、次のようなテキストに変換されていました。

[E:confident]
[E:happy01]
[E:wink]

長さ不定。先頭三文字と最後は決まった文字で、挟まれた文字は、a-zが何文字かならび、そのあとに二ケタの数字が並ぶ時と並ばないときがある…という条件のようです。

正規表現ブログ人の絵文字を検索/置換する

爺は正規表現得意でないです。これで正解かどうか自信はないですが、やってみたら成功した、ということでご理解を。

\[E:+[a-z]+[0-9]{0,2}+\]

TAKAががつて勉強した正規表現の教科書は「入門 正規表現 ~検索・置換・テキスト処理に強くなる!」というタイトルです。


つかったテキストエディタはMeryです。なので、ことなるエディタだと表現が違う場合があるかもしれません。そのあたりはご容赦を~。

検索して正確にヒットすれば、単に削除するか、なにか別の文字/記号をいれるかはできるかと思います。

画像、Word、PDFなどのダウンロード/バックアップ

ブログ人」には画像、Word、PDFなどを一括してダウンロードできるツールは無いようです。ということで、無料ツールを見つけて、大部分をDLしました。
使ったツールは、GetHTMLWです。

GetHTMLWでは、画像とWordは無事DLできましたが、PDFは取得できませんでした。先にDLしたテキストデータ(記事データ)のなかから、「.pdf」を検索し、該当URLをコピーし引っ張り出すという手作業をおこないました~シクシク。でも、まあ、こんなものかと。画像を手作業でDLすることを考えると、まあ、くたばるほどの作業ではありませんでした。
なお、画像の種類がすべてOKなのかどうかについては未確認です。すみません。

Word、画像などのフォルダが別にできる

DLしたテキストデータのURLに沿ってフォルダがイロイロできます。画像関係はふたつありました。
これをWPに「uploads」フォルダ内にどう配置するかは、それぞれのお考えかと…。DLしたテキストデータのURL部分を移行先のフォルダ配置にあわせてURLを書き直す作業は、Meryの置換機能でおこないました。

画像関係を置換し、仮設サイトで確かめたらPDFがNGであることに気づき、あとでPDF関係のURLなども置換した、というのが耄碌爺の実際の作業でした。あ、Wordも…。