ブログを移転しました!

はてなブログからWordPressに移行する際に「キーワードリンク」を削除する方法!

はてなブログからWordPressに記事を移行する際、はてなブログの記事に埋め込まれているキーワードリンクなど、WordPressに移行する上で必要のない情報がいくつかありました。

その1つに「キーワードリンク」があるのですが、キーワードリンクはMacやWindowsのエディタで簡単に削除できましたので、その方法をご紹介します!

まずは「はてなブログ」から記事をエクスポート(出力)するところから。

はてなブログから記事をエクスポートする

はてなブログから記事をエクスポートするには、「ダッシュボード」→「設定」→「詳細設定」の下の方になる「エクスポート」から「記事のバックアップと製本サービス」に進みます。

エクスポートの画面となりますので、エクスポートのボタンを押して、少し待つと、ダウンロードボタンが表示されますので、自分のパソコンに記事データをダウンロードします。

ダウンロードした記事データはテキストファイルになっています。

このままWordPressに取り込んでもエラーなどは出ず問題はないのですが、冒頭でお話ししたとおり、何もしないと不要な情報がたくさん含まれています。

これから不要な情報を削除するには、テキストファイルを見て1つ1つ削除していっても良いのですが、出来るだけ少ない手間で削除する方法をご紹介したいと思います。

作業はMacやWindowsでおすすめのソフト(テキストエディタ)が異なるので両方ご紹介します。もちろん目的は同じなので、ツールは違えどやっていることは同じです。

Macでは「CotEditor」、Windowsでは「サクラエディタ」をインストール

最初に記事データのテキストファイルを編集するテキストエディタをダウンロードしてインストールします。

Macであれば「CotEditor」が定番です。

Windowsでは「サクラエディタ」がオススメです。

「CotEditor」と「サクラエディタ」で文字列を置換する方法

記事データから不要な箇所を削除するのですが、やりたいことは記事データの不要な文字列を置きかえる(置換する)ことです。「削除」するということは、データなしに置換ということになります。

「CotEditor」や「サクラエディタ」を使えば、この文字列の置換が簡単にできます。

文字列を置換するという目的は同じなので、まずは2つのソフトでのやり方をご説明します。

Mac「CotEditor」文字列置換の準備

インストールした「CotEditor」を起動して記事データを開きます。

アプリを起動
記事データを開く

早速下の方にはてなキーワードのリンクが見えますが、実際に置換する前に、まずはやり方だけ。

ショートカットキー「Command+F」か「ツールバー」の「検索」をクリックします。

検索と置換ウィンドウ

この検索ボックスの「正規表現」にチェックしておいてください。

これで「CotEditor」の準備は終わりです!

Windows「サクラエディタ」文字列置換の準備

インストールした「サクラエディタ」を起動して記事データを開きます。

サクラエディタを起動
記事データを開く

ショートカットキー「Control+R」か「ツールバー」の「置換」をクリックします。

置換ウィンドウ

上記のように「正規表現」にチェックして、置換対象は「選択文字」、範囲は「ファイル全体」にしておいてください。

これで「サクラエディタ」の準備ができました!

記事データから「キーワードリンク」を一括削除!

これから実際に「キーワードリンク」を削除していきます。

テキストエディタで文字列を置換するメリットは一括削除できることです。記事データが多ければ多いほど、目視で削除したい場所を探して消し込んでいくのは大変です。

はてなブログのキーワードリンクは以下のような構造になっています。

<a class="keyword" href="http://blog.hatena.ne.jp/-/campaign/hatenablog-5th-anniversary">はてなブログ5周年ありがとうキャンペーン</a>お題第一弾〜

キーワードリンクは太字にした<a>タグに囲まれた部分によって出来ています。(<a>タグでリンクになります。リンク先は「はてなキーワード」のアドレスです)

他のキーワードリンクを見ていくと、先頭部分の「<a class=”keyword”」と最後の「 </a>」は、どんなキーワードリンクであっても同じ構造になっていることがわかります。

しかしこの範囲を全て削除してしまうとキーワードに続く「お題第一弾〜」という文章が成立しなくなりますので、この例でいうと「はてなブログ5周年ありがとうキャンペーン」という文の一部は残しつつ削除したい。

なんかめんどくさそうですが、テキストエディタであれば簡単にできてしまうのです。

答えからいきますと、置換する対象は以下ように指定します。

<a class="keyword" href="[^"]+">(.*?)</a>

これは正規表現というものを使っているのですが、左から意味を簡単にご説明します。

前半の「<a class=”keyword” href=”[^”]+”>」は、<a〜href=”のあとに何かしら文字が入っていて、”>で終わっている箇所という意味となります。

「(.*?)」の括弧()は、削除せずに残しておきたい文字が入っている部分を変数$1に代入するということと意味しています。

「( )」の中身の「.(ドット)」文字列の1文字目を取得するという意味で、「*(アスタリスク)」繰り返し「?」何度繰り返していいか分からないときに使う記号で、文字を取得し終わるまで繰り返すという意味になります。これで、この括弧()の範囲にある文字が何文字であろうと取得して変数$1に代入させることができます。

結果、CotEditorとサクラエディタの設定はこうなります。

CotEditor
サクラエディタ

置換後は取得した文字列を残したいので、置換する値は変数$1ということになります。

この設置を言葉にすると、

記事データから<a class=”keywords 〜</a> となっている部分を見つけて、取得した$1に置き換える。

作業としては、このまま「すべて置換」とやってしまってもいいですし、一度「すべて検索」や「下検索」をして、どこが置換されるか確認しながら置換しても大丈夫です。

以下はCotEditorの結果になりますが、無事キーワードリンクが消えました!

もちろんサクラエディタでも同じ結果になります。

このようにテキストエディタを使うと、任意の文字列を一括で削除したり置き換えたりすることができます。

キーワードリンク以外にも、ブログを移行する際はハンドルネームを一括置換したかったり、広告を削除したかったりすると思いますので、こちらを参考に作業をしてみてください!

コメント

タイトルとURLをコピーしました