正規表現
ハロプロファンの重要な情報源として、狼スレがある。2ちゃんねる(現 5ちゃんねる)という匿名掲示板のスレッド。有名なのが一人で行くシリーズ、コンサートの簡単な感想や、セットリストがのっていてとっても便利。文字情報なのもうれしいね。網膜色素変性症な私デスペア。ほぼ全盲な視覚障害者の私。テキストだけで構成されている2ちゃんねるの狼スレはありがたいね。
ただ、最近は、いわゆるアラシと呼ばれる、テーマと無関係なコメント投稿書き込みをする人が多くなって、しだいに見るのをやめていった私。その書き込みが有用ななものかどうかすぐには判別できない私。目だだと読み飛ばすということができるけど、目の見えない私は、それができない。耳で聞き飛ばしというのはできない。
アラシ書き込み以外にも、私にとって不要な文字情報もある、たとえば、リンク文字、http://aaaaaaaaaaaとかいう文字、あと、名無し募集中。。。2020/08/26とかいう文字もいらない。
書き込み本体だけをよみたい。
そんなとき私は、書き込みをすべて、1000レスすべて表示させて、それをすべて範囲選択して、それをコピーして、テキストエディタにはりつける。
私がよく使っているのは、視覚障害者のためのテキストエディタ、高知システム開発がつくている、MY EDIT マイエディットというテキストエディター、文章作成ソフト。
このマイエディットに全部のレスをはりつける。
そして、置換でいらない文字を空白にする。
正式には、正規表現で置換 という作業をする
以下、備忘録として、MY EDITマイエディット での正規表現をメモしておこう。
デスペア的視覚障害者のための、MY EDIT マイエディット の正規表現で置換するポイント
1、空行、空白行(空白のぎょう)、改行のみ、の行だけを削除する。
まず、空行、空白行がたくさんあるので、まずはそれを削除する。
正規表現の置換で
検索する文字列に
^[ | |\t]*\n
置換する文字列に
なにも入れない
それで置換を実行すると、あら不思議、空行や、空白行、空行、開業だけの行がすべて削除される。
この正規表現をかいせつすると、
^ べきじょうマーク は行(ギョウ)の先頭をを意味している
[] かくかっことかくかっことじ の間には、2本の | 縦棒がある。その縦棒は、半角スペース、全角スペース、\t の3つが区切られている。
つまり、行の先頭が、半角スペースか、全角スペースか、タブ空白の場合という意味になる。
そして、最後の
\n エンマークえぬ は改行をあらわす。
つまり、
行の先頭が、半角スペースか、全角スペースか、タブ空行ではじまり、最後が改行でおおわっている、そんな行を検索するという意味。
そして、その検索したものを、置換する文字列は空欄なのでm、なにもない、つまり消去することになる。これで空白ぎょうが消える。
あそうそう、\nの前にある*アスタリスク、その前の文字列、ここでは半角スペースか全角スペースかタブ空白が0個以上くりかえされるという意味。このあすたりすく大事。
2、名無し募集中という文字がが書いてある行を削除するには
^.*名無し募集中.*\n
(読み方は べき乗 ピリオド アスタリスク 名無し募集中 ピリオド アスタリスク エンマーク エヌ)
を検索する文字列にいれて、置換する文字列には何もいれないで、置換を実行すると、あら不思議、名無し募集中とかかれた行がすべてきえる。
これを参考にして、
http が含まれている行をさくじょするには
検索する文字列に
^.*http.*\n
woをいれればよい。あとはレスの引用文字
>>1
とというのも消すのなら
^.*>>.*\n
を使えばいい。
ぜひみなさんも、この正規表現をつかって、スレッド書き込みをみやすくして、たくさん情報を入手してね。できれば宮本佳林ちゃん応援スレ に毎日書き込みしてね。よろしくお願いします。
ハロプロファンの重要な情報源として、狼スレがある。2ちゃんねる(現 5ちゃんねる)という匿名掲示板のスレッド。有名なのが一人で行くシリーズ、コンサートの簡単な感想や、セットリストがのっていてとっても便利。文字情報なのもうれしいね。網膜色素変性症な私デスペア。ほぼ全盲な視覚障害者の私。テキストだけで構成されている2ちゃんねるの狼スレはありがたいね。
ただ、最近は、いわゆるアラシと呼ばれる、テーマと無関係なコメント投稿書き込みをする人が多くなって、しだいに見るのをやめていった私。その書き込みが有用ななものかどうかすぐには判別できない私。目だだと読み飛ばすということができるけど、目の見えない私は、それができない。耳で聞き飛ばしというのはできない。
アラシ書き込み以外にも、私にとって不要な文字情報もある、たとえば、リンク文字、http://aaaaaaaaaaaとかいう文字、あと、名無し募集中。。。2020/08/26とかいう文字もいらない。
書き込み本体だけをよみたい。
そんなとき私は、書き込みをすべて、1000レスすべて表示させて、それをすべて範囲選択して、それをコピーして、テキストエディタにはりつける。
私がよく使っているのは、視覚障害者のためのテキストエディタ、高知システム開発がつくている、MY EDIT マイエディットというテキストエディター、文章作成ソフト。
このマイエディットに全部のレスをはりつける。
そして、置換でいらない文字を空白にする。
正式には、正規表現で置換 という作業をする
以下、備忘録として、MY EDITマイエディット での正規表現をメモしておこう。
デスペア的視覚障害者のための、MY EDIT マイエディット の正規表現で置換するポイント
1、空行、空白行(空白のぎょう)、改行のみ、の行だけを削除する。
まず、空行、空白行がたくさんあるので、まずはそれを削除する。
正規表現の置換で
検索する文字列に
^[ | |\t]*\n
置換する文字列に
なにも入れない
それで置換を実行すると、あら不思議、空行や、空白行、空行、開業だけの行がすべて削除される。
この正規表現をかいせつすると、
^ べきじょうマーク は行(ギョウ)の先頭をを意味している
[] かくかっことかくかっことじ の間には、2本の | 縦棒がある。その縦棒は、半角スペース、全角スペース、\t の3つが区切られている。
つまり、行の先頭が、半角スペースか、全角スペースか、タブ空白の場合という意味になる。
そして、最後の
\n エンマークえぬ は改行をあらわす。
つまり、
行の先頭が、半角スペースか、全角スペースか、タブ空行ではじまり、最後が改行でおおわっている、そんな行を検索するという意味。
そして、その検索したものを、置換する文字列は空欄なのでm、なにもない、つまり消去することになる。これで空白ぎょうが消える。
あそうそう、\nの前にある*アスタリスク、その前の文字列、ここでは半角スペースか全角スペースかタブ空白が0個以上くりかえされるという意味。このあすたりすく大事。
2、名無し募集中という文字がが書いてある行を削除するには
^.*名無し募集中.*\n
(読み方は べき乗 ピリオド アスタリスク 名無し募集中 ピリオド アスタリスク エンマーク エヌ)
を検索する文字列にいれて、置換する文字列には何もいれないで、置換を実行すると、あら不思議、名無し募集中とかかれた行がすべてきえる。
これを参考にして、
http が含まれている行をさくじょするには
検索する文字列に
^.*http.*\n
woをいれればよい。あとはレスの引用文字
>>1
とというのも消すのなら
^.*>>.*\n
を使えばいい。
ぜひみなさんも、この正規表現をつかって、スレッド書き込みをみやすくして、たくさん情報を入手してね。できれば宮本佳林ちゃん応援スレ に毎日書き込みしてね。よろしくお願いします。