獲得された絶望感(盲人ウエカジ @ウエカジハローセンター 公式ブログ)

~網膜色素変性症と司法試験とモー娘。と全盲ヘルパー事業所と・・・~

視覚障害者のためのテキストエディタ MY EDIT マイエディット で、空行を一挙に削除することができた。

2020-08-26 22:17:39 | 全盲の視覚障害者でも一人で使える家電、情報機器、アプリ獲得プロジェクト
正規表現

ハロプロファンの重要な情報源として、狼スレがある。2ちゃんねる(現 5ちゃんねる)という匿名掲示板のスレッド。有名なのが一人で行くシリーズ、コンサートの簡単な感想や、セットリストがのっていてとっても便利。文字情報なのもうれしいね。網膜色素変性症な私デスペア。ほぼ全盲な視覚障害者の私。テキストだけで構成されている2ちゃんねるの狼スレはありがたいね。

ただ、最近は、いわゆるアラシと呼ばれる、テーマと無関係なコメント投稿書き込みをする人が多くなって、しだいに見るのをやめていった私。その書き込みが有用ななものかどうかすぐには判別できない私。目だだと読み飛ばすということができるけど、目の見えない私は、それができない。耳で聞き飛ばしというのはできない。

アラシ書き込み以外にも、私にとって不要な文字情報もある、たとえば、リンク文字、http://aaaaaaaaaaaとかいう文字、あと、名無し募集中。。。2020/08/26とかいう文字もいらない。

書き込み本体だけをよみたい。

そんなとき私は、書き込みをすべて、1000レスすべて表示させて、それをすべて範囲選択して、それをコピーして、テキストエディタにはりつける。

私がよく使っているのは、視覚障害者のためのテキストエディタ、高知システム開発がつくている、MY EDIT マイエディットというテキストエディター、文章作成ソフト。

このマイエディットに全部のレスをはりつける。
そして、置換でいらない文字を空白にする。

正式には、正規表現で置換 という作業をする

以下、備忘録として、MY EDITマイエディット での正規表現をメモしておこう。

デスペア的視覚障害者のための、MY EDIT マイエディット の正規表現で置換するポイント

1、空行、空白行(空白のぎょう)、改行のみ、の行だけを削除する。

まず、空行、空白行がたくさんあるので、まずはそれを削除する。

正規表現の置換で

検索する文字列に

^[ | |\t]*\n

置換する文字列に
なにも入れない

それで置換を実行すると、あら不思議、空行や、空白行、空行、開業だけの行がすべて削除される。

この正規表現をかいせつすると、

^ べきじょうマーク は行(ギョウ)の先頭をを意味している

[] かくかっことかくかっことじ の間には、2本の | 縦棒がある。その縦棒は、半角スペース、全角スペース、\t の3つが区切られている。

つまり、行の先頭が、半角スペースか、全角スペースか、タブ空白の場合という意味になる。

そして、最後の

\n エンマークえぬ は改行をあらわす。
つまり、
行の先頭が、半角スペースか、全角スペースか、タブ空行ではじまり、最後が改行でおおわっている、そんな行を検索するという意味。

そして、その検索したものを、置換する文字列は空欄なのでm、なにもない、つまり消去することになる。これで空白ぎょうが消える。

あそうそう、\nの前にある*アスタリスク、その前の文字列、ここでは半角スペースか全角スペースかタブ空白が0個以上くりかえされるという意味。このあすたりすく大事。

2、名無し募集中という文字がが書いてある行を削除するには

^.*名無し募集中.*\n

(読み方は べき乗 ピリオド アスタリスク 名無し募集中 ピリオド アスタリスク エンマーク エヌ)

を検索する文字列にいれて、置換する文字列には何もいれないで、置換を実行すると、あら不思議、名無し募集中とかかれた行がすべてきえる。
これを参考にして、

http が含まれている行をさくじょするには

検索する文字列に

^.*http.*\n

woをいれればよい。あとはレスの引用文字

>>1
とというのも消すのなら

^.*>>.*\n

を使えばいい。

ぜひみなさんも、この正規表現をつかって、スレッド書き込みをみやすくして、たくさん情報を入手してね。できれば宮本佳林ちゃん応援スレ に毎日書き込みしてね。よろしくお願いします。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする