MT復旧 - html→export形式編(part2)

はい。シリーズ第2回ですー。

さて、夜22時ごろに「まとまった時間があるなー」ということで、必要があるのかないのかも不明なまま html→MTエクスポート形式 に変換するプログラムを作り(直し)はじめたわけですが、その後どうなったでしょうか。

いやードキドキしますねー(しねぇよ



また例によって例のごとく、私のメールから。

6/22 01:38  件名 : 作業完了w

時間あるうちにちょっとやるか...ということでやってたら終わりますたw

まぁ使うかどうかは別として、とりあえずご報告まで。

(MTエクスポート形式ファイル)
http://自宅さーばー/xxx/output.txt (2MB)
最新エントリ以外を入れてます。
最新エントリはコメ欄なしのため、ちょっと自作プログラムのエラーが出るので抜きました。

(検証用テストサイト)
http://自宅さーばー/xxx/
http://自宅さーばー/xxx/cgi/mt/mt.cgi (id:xxx pass:xxx)

自宅さーばー というのは、私の家のマシンです。(NotePC/Linux)
私のブログサイトはさくらで借りているのですが、とあるRSSリーダを動かすために自宅マシンを設置していて、そこでMTのテスト環境を作りました。
作ったエクスポートファイルを素のMT3.35に読み込ませた結果です。

さて、結局以前のプログラムを修正して作ってみたわけですが、
なんですかこのコメント数はwwwwwww
48エントリで6289コメント(TB:93)ってどんだけ~w

テスト環境はsqlite dbにしてますが、このサイズが3.5MB。
なるほどロリポではパンクするわけです。
私の過去の感覚だと、この作ったファイルをロリポにインポートするのは至難の業です。無駄なコメントをそぎ落としてから入れるか、根本的に移転することをすすめます。

sqliteの場合(というかMT全般としても良いですが)、このDBサイズがパフォーマンスにめちゃくちゃ響きます。エントリは少なくてもコメントがふくれてDBが大きくなっていたのですね。

ちなみに私のブログはDB 10MBくらいあります(さくらでは問題なく動作します)。過去5-6MBくらいの時に耐え切れずに移転したような記憶があります。

というわけで。
勝手に色々やってすみません。
他にやってる方でうまいこといったなら無視してください:)
テストサイトはあくまでテストなので、すぐ消せます:)

あ、最後に。自分も忘れそうなので注意事項を。

1. エントリー本文内で div タグをもし使っていれば、その時点で本文が途切れていると思います。(本文終了の目印を /div で取ったりしてるので)

2. また、コメントのところにメールアドレスだけ書いている人のチェックもあまりしていません。(URLは拾っていて、メールのみ書いている人もURL同様に拾っているはずなのですが、本来メール欄に入るべきアドレスがURL欄に入っているかのように拾っています。いくつかのプラグインで問題になることがあります。)

自作プログラムでばーっと処理しただけで、プログラム上のエラーチェックとしてはOKなのですが完全とは言い切れません。もしこれを何かの形で使うのならば、できる限り目視でチェックしてください。


なんということでしょう。


必要かどうかもわからないのになんか勝手にやっていて、しかも人のサイトのコピーまで作っている始末w


いやぁ人間って恐ろしいですねぇ....ってそういうことじゃなく!
自動処理なので、どーしても(ブログの)作成者が目視をしてチェックする必要があるのです。
ちゃんとデータが過不足なく吸い上げられてるか、ブログ主でしか判断できないので。

あ、ちなみにftpのid/passをもらっていたわけでもなんでもなく、archives.htmlがちゃんとしてそうだったのでそこからツールでlocalに根こそぎ保存して、自作ツールをかけて変換したということです。

人のブログ丸ごとコピーするのも、あながち無理な話じゃないな...(バカ
ま、もちろんテンプレートを持ってくることはできないので、完全なコピーは難しいですけど。


さて、夕方頃にお返事いただきまして、
 「頼んでいた人はうまくいかなかったのでとてもありがたい」
 「さくらへの移転を考えていてお手伝いしてほしい」
 「スパム対策はどうすれば?」

いやー 無駄にならなくて良かった:)

6/22 18:19

こんにちはー。
うまく使えそうですかね。良かった良かった。
さくらへの移転はできる限りお手伝いしますよ。
とりあえず申し込んでいただいて、ftpのアドレス,id,passを教えていただければ、まずさくらのデフォルトアドレスのまま作ります。
(passは終わった後に変更していただければ)

作り終わった後に、ドメインをロリポ→さくらに移します。
これはドメイン取得サイト(ムームー?ですかね)での設定と、ロリポでも確か設定があったようななかったような....、あとさくらでの設定ですね。

スパム対策は、MTの標準機能を設定することでかなりの部分しのげます。
TBスパムはそれでも結構来て大変なので、私がやっているのは、
・TBのcgiの名前を変更してしまって、それをエントリ内に但し書きで表示する
というやり方です。これめちゃくちゃ効果あります。

私のエントリのトラックバックのところを見ていただければわかると思います。
http://www.nnistar.com/archives/200706221230.php
プログラムスパマーじゃなく、人間で送ってくる人はこの但し書きでわかってくれますので。

なお、↑では私が大部分作業するようなイメージで(とりあえず)書いていますが、ご自分でできる限りやりたいということでしたらもちろんそれでも構いません。

ではでは。


その夜、返信きました。
さくらと契約したとのこと。早っ!

id,passをいただいたので、さくらでMT環境を構築することに.....

6/23 01:42

了解ですー。
ちょっとやってみますー。
しばしお待ちをー。


次回に続く!

Track Back

Track Back URL

コメントする

公開されません

(いくつかのHTMLタグ(a, strong, ul, ol, liなど)が使えます)