ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

正規表現でのチェック方法を考える-その10 文字数混在と、何文字(何桁)指定

2008-04-30 17:35:44 | 正規表現

チェックは、正規表現でやれば、いろんな言語でいけそうなので、正規表現で、いろんな値をチェックする方法を考える、シリーズ「正規表現でのチェック方法を考える」

いままで、文字と数字のチェックをやってきたので、今回は、混在についてやります。
また、桁数、文字数について書いていなかったかもしれないので、書いておきます。

なお、このシリーズで、特に断りのない限り、全角の¥は、本当は半角の円マーク(ないしはバックスラッシュ)です。




■課題

こういう学生番号があったとします。

A12-9876J


1文字目   A-Zの英字1文字 - 学部学科を表す
2-3文字目 数字2桁     - 入学年度(08=>2008年入学)
4文字目   -(ハイフン)  - 固定
5-8文字目 数字4桁     - 学生固有の番号
9文字目   A-Zの英字1文字 - チェックデジットをアルファベットに変換



で、このチェックをします。

今回は、アルファベットがA-Zなので[A-Z]となり、数字のところは\dになります。
あと、桁数が決まっているので、桁数指定です。




■桁数指定

桁数は、{数字}を書くと、その数分、前にかかれたものが続くことになります
¥d{2}だと、2桁分、¥d=数字が続きます。

なお、何桁から何桁の間という場合は、{開始,終了}のように、,で区切って書きます。
2桁から6桁なら{2,6}
未入力から、5桁=5桁以下なら{0,5}
みたいなかんじです。




■ソース

ということで、課題は、
/^[A-Z]¥d{2}-¥d{4}[A-Z]$/
ということになります。これをもとに、プログラムしたのがこちら

<HTML>
<HEAD>
<TITLE>JavaScriptテスト広場</TITLE>
<SCRIPT LANGUAGE="JavaScript"> 
<!--
function load()
{
}

function mycheck(val)
{
	if (val.search(/^[A-Z]¥d{2}-¥d{4}[A-Z]$/)	!=	-1 )
	{
		alert("OK");
	}
	else
	{
		alert("エラー");
	}
}
-->
</SCRIPT>

</HEAD>
<BODY onload="load()">
<FORM NAME="buf">
<INPUT NAME="Text1" TYPE="hidden">
</FORM>

<FORM NAME="zikko">
<INPUT NAME="text1" TYPE="TEXT">
<INPUT NAME="button1" TYPE="BUTTON" VALUE="実行" onclick=mycheck(text1.value)>
</FORM>
</BODY>
</HTML>

(上記 ¥ < > は、本当は半角)




■ということで・・・

 このシリーズはとりあえずいったん終わりとします。

 ほんとうはあと、各言語における正規表現の書き方というのがあるのですが、
それについては、気が向いたらやります。

で、今回のシリーズについてまとめたのが、

ここ http://www.geocities.jp/xmldtp/index_check.htm

のページです(エイプリールフールのときに使ったページ。
ちゃんと、今回正規表現が埋まっています)。



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Whatが目標、戦略で、Howが戦術なら、戦略はデータで示し、戦術はプロセスを示すってこと?

2008-04-30 15:23:02 | Weblog

 昨日の入門ビジネス英語で、インテルの人が、Whatが戦略(ストラテジー)で目標とかを示し、Howが戦術(タクティクス)っていうことを言っていた。

 情報処理において、情報であるデータが、Whatにあたり、処理内容であるプロセスがHowにあたることになる。
 ということは、目標=ゴールすなわち、戦略は、Whatにあたる、データで定義されるべきであり
(売り上げいくらいくらとか、何々工場建設とか)
 戦術は、Howつまり、どういう手順でやるかで規定されることになる。

 しかし、Howにおいても、さらに階層化され、いくつかの細分化された目標=データ=戦略が定義され、それに対するプロセス(HOW)も定義されることになる。

まとめると(若干付け足し)、


出力情報(出力データ)  =  目標・ゴール = What  = 戦略
  ↑
 処理(プロセス)    =  やり方    = How   = 戦術
  ↑
入力情報(入力データ)  = 現在のリソース       = 資産




こんなかんじなのかしら


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

リクルートとか、Gooあたりが、求人情報のメタタグを定義すれば、求人検索は簡単では?

2008-04-30 12:05:56 | Weblog

 で、さっきのつづきで、GoogleやGooの検索で、希望の求人情報だけをだす、たとえば、

  「東京都のコンピューター関係で正社員月給30万以上」

 とかにするには、どうしたらいいか・・・

 きっと、この業界の人なら、「それは、セマンティックWebですよ!そのためにはマイクロフォーマットを使い・・」ってくるだろうけど、そんなことしなくていいんじゃない?
 
 リクルートとか、Gooあたりが、求人情報のメタタグの標準化をすればいい。

 たとえば、
募集地域をあらわすには、<meta name="keywords" content="KYZN住所東京都">
業種をあらわすには、<meta name="keywords" content="KYZN業種コンピュータ">
正社員、パートは<meta name="keywords" content="KYZN種別正社員">

のように、メタタグに、KYZN-種類-値(ハイフンは書かない)の順に書いてもらい
(月給は30~50万だったら
<meta name="keywords" content="KYZN月給30万">
<meta name="keywords" content="KYZN月給40万">
<meta name="keywords" content="KYZN月給50万">
のように10万おきに書いてもらう)

検索エンジンのロボットが(今はメタタグってあんまりみてないかもしんないけど)そのメタタグを見るようにして、

検索する人は、

 KYZN住所東京都 KYZN業種コンピュータ KYZN月給30万

のように、その標準化されたタグで検索すればいい。

このタグは、採用ページに入れてもらうようにすれば、採用ページに出てくる重要語(特徴語)は決まっているので、それをチェックすることによって、スパムの排除もしやすい(重要語は、tf*idfで調べると思うけど、求人広告の中にスパムを入れてしまうと、求人の重要語のtfが下がるので採用ページとは認識されなくなる)。

 こうすれば、高齢者歓迎のような求人募集も、KYZN年齢高齢者 が入っているかどうかを見ればいいだけだから、簡単に検索できそう。おお、高齢者雇用に力を入れている、厚生労働省のますぞえ大臣もおよろこびに・・・ならねーか(^^;)




 じゃあ、そーなったら、リクルートとかの求人会社は、どーなるのよ!っていうお話だけど、
 求人会社は、お墨付きを与えればいい。
 つまり、Webサイトで検索できる求人情報はいっぱいあるけど、そのなかには、あやしー(-_-;)ものも、多いと思う。そこで、求人会社は、その中から、ちゃんと調査して、自分のサイトに載せるというようにすればいい。

 なので、むしろ、このタグで、求人している会社が見つかれば、そこに営業をかければいいので、求人会社にも、メリットあり?応募する人は、安心なほうがいいので、結局求人会社の情報を見る人も多いと思う。

 うーん、どーでしょー(^^;)

P.S なんか、ほかのセマンティックWebも、メタタグのキーワードで済みそうな気がしてきた・・



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Googleが世界一の就職情報サイトになる日も近い?。。。

2008-04-30 01:33:25 | Weblog

ここの記事
学生の就職情報2009」の水増し表示疑惑、そのカラクリを検証
http://gigazine.net/index.php?/news/comments/20080428_gakusei_enjapan_2009/

(以下斜体は上記サイトより引用)


読者からのタレコミによると、エン・ジャパンの「学生の就職情報2009」という就活サイトにおいて、現時点で「採用情報13,147社」と表示されているが、実際にはこの10分の1程度しか掲載されておらず、水増しの疑いがあるとのこと。


じつは、たしかに、13,147社ではあるのだが。。。


1843件:[en]学生の就職情報 編集部が訪問し、独自取材をおこなった会社の情報

11304件:ジョブポータルがネット上で求人している会社のページを勝手に収集してきた数

合計:1843+11304=13147件


つまり、実際に訪問して、求人情報を得ているのが、1843社で、のこりは、
ジョブポータルというインターネット上に存在する採用情報を自動的に収集する ロボット型検索システムを使って集めたもの・・・らしい

ちょっとまて!

それなら、Gooとか、Yahooとか、グーグルが、もし、求人募集のみを集めてくるような検索を開発すれば、そっちのほうが、勝っちゃわないか?

Googleで「採用情報」で検索すると、11,400,000件で、ちなみにはじめの10社は、
東芝
松下
読売新聞
USEN
KIRIN
JAL
ブリジストン
マイクロソフト
Honda
アップル

だ。。。そのつぎは

FUJIFILM
明治製菓
トヨタ自動車
財務省
資生堂
神戸市職員
ライオン
NHK
総務省
ベネッセ


つーか、Gooとか、Yahooとか、グーグルが、自分で開発しなくても、「そーいうコーナーをつくるから、みんなあ、申し込んでえ・・(格安2000円)」とかにしておけば、みんな、申し込むんじゃないか?

そーすると、求人のみをやっているところは、不利なんじゃあ。。。
 
P.S すっげーいいことおもいついた!
   これがあれば、高齢者の求人とかもすすみますぜ、ますぞえ大臣様
   だけど、もう、夜遅いので、明日書く。

ねて、忘れないように、キーワードだけメモメモ

求人情報の標準化
マイクロフォーマット
ロボット検索
標準メタタグ
高齢者求人メタタグ



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする