ブログの文章２年分をダウンロードした

2014年01月08日 08時46分12秒 | パソコン、スマホ、その他電気製品

　サーバー側を見るとブログはいわゆるホームページとは違う。特定のカテゴリーの記事だけ表示するなんてのは普通のホームページでは無理。何故ならファイルやフォルダーの場所が固定されているからだ。でもブログは違う。ブログのサーバーがブログを見てる人の要求に応じてデータを組み立ててブラウザに送る。ファイルやフォルダーの場所が変化するのだ。

　例えばこのブログの山とか壁を登るをクリックする。それを受け取ったブログのサーバーは山とか壁を登るの記事の中から最新の１５記事を選んで表示する。次に利用者が« 前ページをクリックすると次に新しい１５記事を選んで表示するのだ。構成はその時々でコロコロ変る。

　ブログのバックアップはどうするかというと俺は日付順にダウンロードすることにした。だけどそうするとカテゴリー毎の表示は出来ない。その逆にカテゴリー毎にダウンロードすると今度は日付順の表示は出来ない。でもそれは仕方ないのだ。

　最後にこのブログのバックアップを取ったのは２年近く前だ。その方法は自分流。手順はというと、月毎のページを全てダウンロードするというもの。そしたダウンロードしたファイルを加工して連結した。ダウンロードするＵＲＬ、例えば２０１３年の１２月だとこうだ。

http://blog.goo.ne.jp/longq/m/201312/0
http://blog.goo.ne.jp/longq/m/201312/1
http://blog.goo.ne.jp/longq/m/201312/2
http://blog.goo.ne.jp/longq/m/201312/3
http://blog.goo.ne.jp/longq/m/201312/4
http://blog.goo.ne.jp/longq/m/201312/5
http://blog.goo.ne.jp/longq/m/201312/6

１１月だとこんな感じである。これが２年分だアクセスすべきＵＲＬの数は２４ヶ月Ｘ６＝１４４個である。

http://blog.goo.ne.jp/longq/m/201311/0
http://blog.goo.ne.jp/longq/m/201311/1
http://blog.goo.ne.jp/longq/m/201311/2
http://blog.goo.ne.jp/longq/m/201311/3
http://blog.goo.ne.jp/longq/m/201311/4
http://blog.goo.ne.jp/longq/m/201311/5
http://blog.goo.ne.jp/longq/m/201311/6

　ここまで書いて思うのはこの記事を読んで参考になったと思う人が居るんだろうかという疑問。でも記事は続く。

　こんな風にアクセスすべきＵＲＬには簡単な規則性が存在する。規則性が存在すれば自動的にダウンロード出来る。末尾の数字が６なのには理由がある。このブログは日に３記事が最多なので毎日書いたとしても月に９０記事。ＵＲＬ１つで１５記事表示なので末尾の数字は６まであれば足りるってわけだ。では２杯目のコーヒー。

　ダウンロードするには wgetというフリーのソフトを使う。これを DOS プロンプトで以下のように実行する。これは２０１３年１２月のブログの一部を 201301_1.htm というファイル名でダウンロードするという意味である。

border="1">図－１　２０１３年１２月のブログの一部を 201301_1.htm というファイル名でダウンロードする

　これらを１４４回手入力するのはヤダ。そのために３つのバッチファイルをテキストエディターで作った。名前は blog.bat、b_year.bat、b_month.bat でその内容は図－３、４、５である。それぞれの関係は blog.bat(図－３) が b_year.bat(図－４) を呼び、b_year.bat(図－４) が b_month.bat(図－５) を呼ぶという関係である。

　図－２のように blog.bat(図－３) を実行すると２０１２年１月から２０１３年１２月までのｈｔｍｌファイルをダウンロードした。画像ファイルをダウンロードしないのは画像ファイルは手元にあるのでする必要がないのである。ダウンロードしたのは文章だけ。で、所要時間はインターネット環境(ボッケ家はフレッツ光回線)によるけどたった１分だけ。

図－２　blog.batの実行

図－３　blog.bat

図－４　b_year.bat

図－５　b_month.bat

　上記バッチファイルの説明は以下の通り。

説明－１　blog.bat(図－３) の説明

説明－２　b_year.bat(図－４) の説明

説明－３　b_month.bat(図－５) の説明

日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【集まれ！野鳥ブロガー】あなたのブログを紹介しませんか？
	訪問者数に応じてdポイント最大1,000pt当たる！
	dポイントが当たる！無料『毎日くじ』

ボッケニャンドリの思ったこと

思ったこと感じたことを書いているけど間違い、勘違い、思い込みも(^^;

ブログの文章２年分をダウンロードした

このブログの人気記事

コメントを投稿

「パソコン、スマホ、その他電気製品」カテゴリの最新記事

カレンダー

プロフィール

最新コメント

最新記事

バックナンバー

カテゴリー

ブックマーク

goo blog おすすめ

goo blog お知らせ