実録!500ページ超のHTMLサイトをWordPressに移転した話

1ヶ月ほど前になりますが、HTMLサイトをWordpressに移転するための手順を紹介しました。実はこの記事で紹介したサイトは「練習」で、この話には「本番」があるんです。

HTMLサイトをWordpressに引越しする方法
例えば、古くから運営しているサイト、または、当初は数ページ程度の小規模なサイトだった場合、HTML(タグ打ちやホームページビルダーなど)で構成されていることが多いです。 これをオウンドメディアのように積極的に更新するためには、HTML...

今回は、

  • 稼動ページ:450ページほど
  • 残骸ページや履歴など:100ページほど

のHTMLサイトをWordpressに引っ越した話を紹介します。これがなかなか骨の折れる作業で・・・

HTMLからWordpressに引越しの手順

基本は同じです。

  1. WordPressの受け皿を用意する
  2. HTML import 2でHTMLサイトをWordpressの投稿記事に吸い上げる
  3. 各記事をチェックして、不要な部分を削除する(合計550ページ!)
  4. 全記事確認したら、index.htmlファイルを削除し、トップをindex.phpファイルに置き換える
HTMLサイトをWordpressに引越しする方法
例えば、古くから運営しているサイト、または、当初は数ページ程度の小規模なサイトだった場合、HTML(タグ打ちやホームページビルダーなど)で構成されていることが多いです。 これをオウンドメディアのように積極的に更新するためには、HTML...

大まかな流れ自体は上記記事で紹介していますので、ここでは実際に疲れた部分(笑)を紹介します。

不要部分の削除大変すぎる・・・

HTML import 2は、例えば<div>タグにはさまれた部分のみを投稿記事に吸い上げることが可能です。なので、記事部分だけを指定すればいいのですが、実際には、

  • 手作りの目次
  • 手作りの関連ページへのリンク

など、不要な情報も多数含まれています。しかも、各ページごとの手作りなので、Search regexのような一括変換プラグインも使えません。

加えて、HTML import 2ではYoutube動画などの埋め込みに使われた<iframe>タグが正常に処理されず、ページが正しく表示できないトラブルにも遭遇したため、結局1記事ずつチェックすることになりました。

これが約550ページ分ありますので、1日2日ではまず終わらないという・・・。

結果的に、(様々な平行作業もした結果ですが)完全に全ページチェックするまでに10日~2週間ほどの時間を要しました。この間も刻々とグーグルの検索順位は動くわけですから、不安定な状況が続くと、なかなか精神健康に悪いです。

ページの分だけhtaccessのリダイレクトを書くの大変

今回引越ししたHTMLサイトは、カテゴリ部分は異なるものの、ファイル名は同じという特徴を持っていました。例えば、

  • /abc/page1.html
  • /def/page1.html

といった構造です。しかし、WordPressは同一のスラッグを設定できないため、このHTMLサイトのURL構造をそのままWordpressに引越しすることはできません

「スラッグ」は、WordPressで作成された記事、カテゴリーやタグなどを示すコードネームのようなものです。

記事の場合は、「投稿名」などと表記されることもあります。

パーマリンクの設定で、「投稿名」を選択している、または「カスタム構造」で「%category%」や「%postname%」などを設定している場合は、スラッグがURLの一部としても利用されます。

スラッグ|WordPress用語集|Zenlogic - ファーストサーバ株式会社のレンタルサーバー
WordPress関連の用語集です。WordPressで作成された記事などを示すコードネームのようなものである「スラッグ」の用語解説。中小企業のためのITソリューションサービス「Zenlogic(ゼンロジック)」。

仕方ないので、全ページを.htaccessファイルで301リダイレクトし、全てのページに新しいURLと独自のスラッグを割り振るに至りました

301リダイレクトは、URLが恒久的に変更された場合に用いられる転送処理のステータスコードです。転送のステータスコードとして他に302リダイレクトがありますが、302リダイレクトは「一時的な転送」を表すものであり、その意味が異なります。

(中略)

サイトの移転などでドメイン自体が変更になる場合や、サイト構成の変更によるURL変更など、URLが恒久的に変更される場合には基本的に301リダイレクトで対応します。

301リダイレクトとは | SEO用語集:意味/解説/SEO効果など [SEO HACKS]
SEO対策の文脈で用いられる用語「301リダイレクト (301redirect)」について解説します。 意味:301リダイレクトとは 301リダイレクトは、URLが恒久的に変更された場合に用いられる転送処理のステータスコ …

リダイレクトはスプレッドシートで記述を作成

さすがに550行もリダイレクトの記述を手で書くのは大変ですので、今回は

  1. WordPressの投稿記事リストとURLをプラグイン(WP All Export)で出力
  2. HTMLサイトの投稿記事とURLリストを作成
  3. スプレッドシート上で記事名で両者をソートし、新旧のページのURLを付き合わせる
  4. そのままCSV出力してフォーマットを整える

という方法を取りました。HTMLサイトの投稿記事タイトルとURLリストは、たまたま手製のサイトマップを作っていたのでそれを使いましたが、自動でサイトを巡回して出力してくれるツールもあったように思います。

このリストを作ったおかげで、重複記事や逆に移転不足(まちがってゴミ箱に入れてしまった記事)などのチェックも行えました。また、移転後しばらくはSearch Consoleの検索結果とURLが一致しませんので、そちらと突き合せるためにも役立ちそうです。

あとはWordpressへ引っ越すだけ

あとは意を決して、引越しを敢行するだけです。


計画してから、実際にWordpressに引越し終えるまで、約2~3週間ぐらいですね。途中、別作業していた期間もあったとはいえ、結構時間がかかりました。

まとめ

  • HTMLからWordpressへの移転は、ページ数が多くなるほど大変。定常的に記事を追加するなら、最初からWordpressで書いたほうが良い
  • 利用したプラグインはHTML import 2とWP All Export。また、スプレッドシートを使って、新旧のURLの対比リストを作成
  • かかった時間は2~3週間ぐらい(途中で別作業 and まったく何もしない日も含む)

これで、筆者保有のHTMLサイトはあと1つ。200ページほどなので、今回のサイトに比べると小物感ありますね!笑

コメント