P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

粒度考:「視野を広く持つ」ではなく「構えを洗練させてみる」の方がしっくりくる

2018-09-27 | 当ブログの基本的な考え方・方針・見解
物事を分割することで「構造」が生まれ、推論や指示系統や相互関係などの「シナリオ」が自ずから喚起される――いきなり抽象的な話から入っていきましたが、物事の枠組みを決定するうえで、分割のスタイルというのは重要なところです。
これは言語においても多分に当てはまります。日常の頻出事項はきめ細かく要素が生まれ、そうでないものは面倒をもって何かの複合的な概念としてなんとか言い表して事を済ませます。
日本語においては梅雨、時雨、五月雨、小糠雨(こぬかあめ)など雨に関する語彙が充実しているのと同様に
英語だとcattle(集合的に畜牛)、cow(雌牛・乳牛)、bull(雄牛)、ox(去勢された雄牛)、calf(子牛)、beef(牛肉)など畜産系の語彙が発達しています。
逆に自国の語彙にないものはひと単語では言い表すことができず、既存語の組み合わせによってあらわすことになります。
これは世界の切り取り方そのものです。切り取り方ひとつで世界の見え方が変わって見えてそこの語彙背景を匂わせながら陳述に動きやムードを纏わせることができます。

話は変わってペンタクラスタキーボードの世界の切り取り方はどうでしょうか。
「でにをは別口入力」によって助詞の境界はハッキリしたおかげで無用なセパレート変換候補は排除されて選択肢が絞られてよりシンプルな世界を目指した、とも言えます。
その一方で助詞でも非助詞であっても統一的にまな板にのっけられることのできた形態素解析のプロセスに余計な分断をもちこんでしまいむしろ事態を複雑化させてしまっているというのも見方によっては真実です。

こういった何に力点を置くか、それによって変わってくる世界の捉え方は「業務プロセスの粒度」であるとか「サービスの粒度」といった形で分解能のきめ細やかさの度合いをこう呼ぶビジネス用語が定着してきておりますが、私流のアレンジを加えると尺度にこだわらずスタイルそのもののありかたをふわっと描いた言葉として、
「粒様」(りゅうよう)といった造語も同じく使っていきたいと思います。
粒度を枝の例えに言い換えることもできます。枝の分岐が2~3又に分かれるのか、多数の枝に一気に分岐するのかという数量的な要素ももちろんありますしもっとイメージで伝えるとしたなら曲がりくねった枝ぶりであるとか峻厳な佇まいの枝ぶりもあるでしょうし、こういった「味」を解釈するうえでは「粒様」のほうが抽象的でより察しがつくというものでしょう。

「井の中の蛙大海を知らず しかし空の深さを知る」という改変ことわざも、一見負けず嫌いのやせ我慢からでた感が見え隠れする表現ではありますがこれもある意味では粒度の幅を絞ってその一方で「空」という深いレイヤーへのリーチはいつでもアクセス可能!…みたいな「選択の潔さ」からくる新たな地平の可能性に気づかせてくれる素敵な表現だと思います。
これとは対極に
「天網恢恢疎にして漏らさず」というのもぼんやりと目に見えないくらいのゆるい網、これは可算数個の粒度では説明しきれず不定数の粒度の概念を持ち込むかのごとくでありますがそのたどり着く先は「すべて漏らさぬ包囲網」であってここにいろんな神秘の明知が詰まっています。
これら二つの例も「粒度の運用法」という共通の眼差しから見たら統一的に説明のつくまな板の問題と捉えることができます。

ここで冒頭のタイトル「視野を広く持つ」ではなく「構えを洗練させてみる」の方がしっくりくる…に立ち返って思いを巡らせてみたいと思います。

粒度・粒様にいろんなパラメータを投げかけることで私たちはさまざまな世界の捉え方を描出できる術を手にしてはいますがそれだけでは世界の全てを知った事にはなりません。
私たちは俯瞰的なポジションにいるとつい錯覚して画一的な操作概念でアクセス可能な事象しかないと思い込んでいますがそんな保証はどこにもありません。
すべてが等価だとしたら先程の言語の例になりますが語彙も文法のなんでもMIXのちゃんぽん言語が効率化を目指した先の最終帰結となるわけですが、実際にはそんなふうにはならないのです。(今のところですが)
「視野を広く持つ」「価値観の多様化」といった言説には何か確固たる軸を持てない、大きな物語を持たない現代人の大いなる悩みから来た苦し紛れのぼやけた表現なのかもしれません。
特に「視野を広く持つ」というのは当世コレクター気質の現代人からすれば、カタログ集め、モンスター集めの営みでしかなくてコンプリート自体が目的化された書庫としての多様性しか意味しておらず奥行きに乏しいものであります。
「知っていれば」「持っていれば」それで終わり、の「そんな人もいるよね」程度の他人事のような世界観です。
このような有様では果たして「本当に知った」ことにはならないのです。
ネット情報に耽溺している私も、ついこんなことにはなっていてはしまいか、大いに自戒したいところです。もっと文脈も汲み取らねば…。

長々と書いてしまいましたが、大事なのは「視野」というスケールの問題ではなく、「構え」というルール/体系を自覚しながら行う営みのほうにより真髄があるのではないか、ということです。
なのでペンタクラスタキーボードのコンセプトもイロモノ扱い、変わり種扱いという辺縁のバリエーションと捉えてしまわれるのではなくなぜ(日アルファベット完全分離・でにをは別口入力・三属性の変換)このような「構え」をもつようになったか、その背景を噛みしめてもらいたいのです。

分かりにくい例えで恐縮なのですが「認知モアレを起こさない」ということも大事です。
「モアレ」とは、二つの規則的な模様が重なった際に起こる幾何学的な干渉縞のことでありますが、これをペンタクラスタキーボードの議論に当てはめると、品詞体系の整合性はどうするのか、変換アルゴリズムは最小コスト法みたいに助詞部分もスコア付けするのか
…みたいな従来線上の議論も当然出てくるかと思われますが、これは十分注意深く行わなければいけない、ということです。
わたくし当方といたしましては、そういった技術的なところで検証されることは喜ばしい事ではありますが、今までの確立された知見をもとにしてだけで話を進めてしまうと私の拙論ではあれがまずい、これがまずい、と厳しいダメ出しを食らうこともあるかとは思います。
ですがもう少しあたたかな立場でご検討をいただきたいということであります。
「構え」が違う以上、お馴染みの議論要素、論点であっても自己導出的な「常識の確認」に終始しているばかりでは何も建設的ではありません。「構えの中の『部分』」の話ですからわれわれは額面通りの論拠で斬るということはできずに、文脈ごと意味するところを論じなけれならないのです。
従来の日本語入力(①)と、ペンタクラスタキーボードの日本語入力(②)についてと、ほぼ同じような技術トピックをあたっているようなときであってもその背景の文脈の違いによって取り扱いを別ものとして扱う方が適切である場合もあるかもしれません。
評論の視点は、その時すでに「広い視野」の俯瞰視点に立っているとの前提でおこなわれますが、実際それが適格なものであるかどうかはふたを開けてみるまで分かりません。
「従来」の線上に①と②を載っけようとするから認識の齟齬=認知モアレが起きてしまうことになるので①②を「別の世界で起こった事象」と捉えて認識形を一から構築せねばなりません。別の世界で起こっている以上、当然物理法則も違うものなのです。


ほとんど抽象的な事ばかりであまり具体的な事には触れられなかったのですいません。
なにぶん模索中の身で自分の言いたいことすらわからない状態でありますのでご容赦頂きたいところなのですが、ここで語った思いのいくばくかが、今後具体的なところが見えてきたときにいつか羅針盤の役割になることができれば満足な事と思います。
今はとりとめもなく筆の進むまま思いの丈を書き連ねていったところであります。お付き合いありがとうございました。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

来阪らいはん 帰函きかん 訪沖ほうおき 渡仏とふつ などの往来表現と変換

2018-09-09 | [Ø]活用と単漢字変換の打開策
よく日常で目にするものですが、
来熊らいゆう・来神らいしん・帰讃きさん・来広らいこう などといった言葉はその地元の人でないと割と読めない字面かも知れません。
(それぞれ熊本・神戸・香川・広島での言い方)

二字熟語による往来表現の一覧 - Wikipedia
というトピックがあります。
各都道府県や国・地域などへの移動・駐在に関する漢字二字の表現は実にさまざまで文字メディアや新聞記事などでは短縮して表現できるためこの用法が多用されています。
しかし使用機会が多いにもかかわらずこの手の言葉が国語辞書にくまなく収録されていることはまずありませんし、ましてやIMEでストレスなく一発変換できるなどという環境もいまだ整ってはいないのが実情です。
今記事ではここらあたりのトピックについてペンタクラスタキーボードのシステムで何か打開策になるような入力の便宜を模索していきたいと思います。

…その前に先述の例のほかのさまざまなケースや有用なリンクなどを解説・紹介していこうかと思うのですが、
大体の地名においては青森は来青らいせい、横浜・浜松は来浜らいひん、名古屋は来名らいめい、鳥取は来鳥らいちょうといった具合に音読みの方で読ませるのが一般的なようです。
栃木県の「栃」の字については励や蛎などの漢字からの類推して「レイ」の読みを編み出す例:帰栃(きれい)もありますが正式な音読みではないものの慣用的にそう読まれているものもあります。
しかし中には来沖らいおき(沖縄)や来崎らいさき(長崎)のように訓読みを使っている例もあるので音読みが絶対だ、というわけでもなさそうです。

あと特殊な例としては東京・京都に限って上京・上洛/入洛の呼び方をするのも健在です。これらは首都東京や京の都の御威光あってのことですね。
調べていくうちレアケースだったのは来寧らいねいというのがあり奈良の古称・雅称「寧楽」(ねいらく)に由来しているものだということを知りました。
このようにさまざまな例がありましたが地方紙・地方メディア・SNS上などで地元の人は当たり前に使っているのを目にしますがこうして異郷の存在からの視点で見ると結構新鮮だったりしますね。

この他にもいろいろな例がありましたが特に北海道には多くの地方都市がありそれぞれ地元の人でないとわからないような独特の字面があるのでここでは詳しく解説はできませんがWebをめぐっているうちに見つけた詳しいサイトがあったのでそちらを↓に紹介したいと思います。
「来道(らいどう)」という呼び方色々 – 北海道ファンマガジン [ファンマガ]


さて、ペンタクラスタキーボードでこれら往来表現二字熟語の変換をサポートできないかという点でありますが、最近の記事でとりあげたトランス音訓変換(パズルのピースをはめる変換)をうまく使って何か有効な入力プロセスはできないだろうか、というのを思案しています。
しかしただトランス音訓変換の手続きをそのままそっくり援用できるかと言えばこれはかなり無理があると言えます。
トランス音訓変換の構成文字リードを導くのに代表変換が使われますが、「ほっかいどう」のリードでは「道」よりも「北」を出したいところですし(訓の「きた」で出そうとすると同音和語の競合が発生するので「ほく」「ほっ」の音を重く見た方が都合がよいという判断)
「おおさか」のリードでは「阪」よりも「大」を出したい(音の「だい」で「大」を出そうとすると代や台などで競合してしまうので訓の「大おお」で出せる手段をもっていることは便宜上必要性がある)といったような独特の代表性選出基準があるからです。
確かにこの地名一字をもって定型素的に連結する生産性の高さは大事なのですが、代表変換の文字はその他にも稀少性・断片活躍性・同音埋没性の各特徴を勘案して最も妥当な"代表字"を選び出しているプロセスですので単に生産性のあるなしをましてや往来熟語だけの代表性推しで決めるわけにもいかないものなのです。
あくまでもローカル対応の一用途での話に過ぎないのでトランス音訓変換(パズルのピースをはめる変換)全体のルールのバランスを崩すことはできません。

なのでここはワンクッション置いて三属性変換の属性ハ(接頭語接尾語がらみ)の変換キーで文字列を把握したあとで続けて新設の②キー(登録ワンタッチキー)を押してトランス音訓変換のフェイズへと複合動作させることで往来熟語に特化した手続きを開始するというのはどうでしょうか。
往来熟語の「来」「帰」「訪」「渡」「在」「駐」「離」などの要素は動詞+場所(目的地)という漢語の語構成を準用した熟語であると同時に生産力要素として接頭辞としてもはたらいているので属性ハで変換しようというのはごく自然な成り行きです。
ただそれだけだと属性ハでの接頭辞というのは接尾辞に比べてやや形勢不利で変換に不安要素もありますし、「らいせい」などといった具合のものをたとえ属性ハとのパラメータが与えられていたとしても変換上位にもってこれるかどうかは地名にもよりますがまず不確実な状況といって良いでしょう。
そこをうまく連携動作させてトランス音訓変換のあて込みをさせるようにさせれば音読みの「せい」のように難儀なヒントで地名をひねり出す苦労もなく、あて込みリードで「あおもり」と入れてしまえば紛れることなく「青」がもってこれます。
これは、前段に三属性変換:属性ハ を噛ませているおかげでその複合動作の登録ワンタッチキーモードは闇雲に代表変換をするのではなくこの場合は往来表現の地名一字をあて込みたいんだな…という文脈の含みをもたせることができるので迷うことなく代表字を出すことができ、しかも未知語に強いという効果も期待できます。
ただしシステム派生ですので設計上も操作上もひと手間掛かってしまうのが大変なところですが、それをおさえて余りあるメリットももたらしてくれるものだと信じています。

イメージを喚起させるために具体的な操作手続きを説明しますと、

<来阪らいはんを複合動作で入力するときの流れ>
1.「らいはん」という文字列を入力してまずこれを三属性変換のものとして変換動作を試みる
2.「らいはん」直後に[属性ハ]キーを押す
3.その後[属性ハ]の後続打鍵はせずここでトランス音訓変換へ移行する
4.新設の②キー(登録ワンタッチキー)を押しここまでの文字列に着目・捕捉動作をする(それと同時に単語登録プロセス開始)
5.これまでの文脈で接頭語+地名の代表字1字だというのを酌んでいるので地名部分の代表変換を促す
6.リード「おおさか」で「阪」をあてはめていく(地名代表字変換)
7.「属性ハ入力」と「らい=来」、「阪」と「はん」がこのとき同時に対応して「らいはん」の詳細が勘案される(複合動作入力/音-訓トランスマッチ)
8.「らいはん」のすべての未変換要素は確定したためここでトランス音訓変換は終了、単語登録も行う

生産力要素の留意をしつつ地名からの代表字のひねりだしという手順は三属性変換とトランス音訓変換の複合動作という解決方法でうまく合致させることができました。
この手順でシステムがうまく回れば、未知語を含む各種往来表現にも広く対応することができます。
注意点としましては各地名・都市名の代表字をその地名ごとに用意しなくてはならないということ(音訓トランス紐づけも含めて整備する)が1つと
それをおこなうのは三属性変換とトランス音訓変換の複合動作としての場面に限定してつくられた往来表現版の代表変換であって、通常の操作文脈での代表変換とは別物であるということであります。
来釧(らいせん) という語自体は未知語であったとしても、釧路の代表字は「釧」という予備知識はもっていないとはじまらないということですね。

あとは外国からの往来表現で
来星らいせい:星嘉坡(シンガポール)
来独らいどく:独逸(ドイツ)
などの例もありますがこれらも同様にリード:シンガポール あるいはリード:ドイツ
をそれぞれ「らいせい」「らいどく」にあて込んでいけばよいかと思います。
もともと国の漢字表記はその国そのものの発音とは違った呼び方になるのですから、地名の代表字の便宜といくらか似通った運用になるものだと言えるでしょう。


…以上で大体の説明は終わりです。
このように複合動作によって往来表現を上手くさばく手立ては見えてきましたが、地名ではなく純粋に未知な複合語一般をひねり出したいときにもこの複合動作の使い道はあるでしょうから作用要件のさらなる検討が必要であるかと思います。
複合動作ということなのでカテゴリ「ジャンル横断的な問題」にしようかとも思いましたが、トランス音訓変換の発展形とも呼べるものですから「[Ø]活用と単漢字変換の打開策」のカテゴリで取り組んでいきたいと思いそちらのカテゴリにすることといたします。
今後もこの系統のトピックは「[Ø]活用と単漢字変換の打開策」で議論・考察を進めていきたいと思いますのでよろしくお願いします。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

アニメキャラ名の止め字を変換できるとうれしい

2018-09-01 | 変換三属性+通常変換のシステム考察
ニャル子・クー子・ハス太・ニャル夫・シャンタッ君・ニョグ太・ナチャ橋・ニャル滝・イス香・アト子・クー音

…これらは名状しがたいアニメ 『這いよれ!ニャル子さん』に出てくるキャラクターの名前です。
これらは日本人一般の人名で目にするパーツや名前の「止め字」と呼ばれる結び要素(子とか太とか)を配置してそれっぽく見せた創作の人名であります。
こんな名前が一発変換できれば面白くないですか?
このような人名はお遊びの範疇でありIMEの機能でわざわざサポートするものでもなかろう、と訝し気に構えてしまわれるのも無理はないかと思いますが、
「コンビニで懐中電灯が売っていればうれしい理論」と同様に、さほど需要がなくともたまにないとすごく困るものが置いてあると店への信頼感がグンと高まり利用基点としての地位を確固たるものにするのと同じ効果が期待できると見込んでいるのです。
アニメキャラに関わらずとも、「ジョニ男」や「チャラ男」のように人称パーツの言葉遊び的用法は一般的でありますので間口は広いイシューなのではないでしょうか。
ここで着目するのは「ジョニ男」や「チャラ男」のように逐一単語辞書に登録しておけばよいというのではなく、ポプ子・ピピ美・ナオ太・ハル子・マミ美・ルル子・モジャ子・パゾ美のような未知語としての人名にも常に変換してくれるという安心感をシステムとして提供できないかということです。

以前このブログで三属性変換の応用例として過去記事
属性選択の遷移過程を反映した変換候補のリオーダリング - P突堤2
において解説してきたことの延長なのですが、
「○○美や○○男などの生産力のあるパーツを使っている」
「それでいて固有の人名を表している」
という2つの条件を具有しているという特徴はまさに「接辞からみの語句=属性ハ」と「人名・名詞=属性イ」の三属性の遷移過程をトレースすれば限定性が際立つので、
単文字「み」や「お」という接続の広い分断のしかたであっても適切に人名/高生産性の「美」であると解釈できるという理屈が成り立つのです。
せっかく通常変換から一歩踏み込んだ三属性変換なのですからこういうローカルイシューを利用しない手はありません。
他にはポメ吉・キキ菜・チワ丸・トケ井・ポメ千代・キョロ乃・ちゃき右衛門 などの人名(ペット名?キャラ名?)などといったものに出会いましたが、
これらのキャラ名は概して基本カタカナ+典型要素 の構成が多いものだと言えますので変換のデフォルトはカタカナで良いと思います。
--中にはちゃき右衛門のようにひらがなであったりトケ井のように苗字部分の止め字だったりする例もありますが基本的な考え方は通じると思います。
あとは「奈」と「菜」や「夫」と「男」などの複数候補がある場合もあるのですがこれは地味に候補選択で使いわけるしかないですね。

もっと発展させて考えるのなら、
立つ瀬無し夫・口先ペラ男・びっくらこき麻呂・がまぐちふくらみの助・口数多子 のようにひとかたまりの句や何がどうしたの言いさしを含むパーツであっても柔軟に対応できればなお良いかと思います。
「たつせなしお」にしても「辰瀬奈塩」のように脈絡のない変換はいかにもこじつけっぽいですし、「お」さえ決定済みというヒントが与えられているのなら「立つ瀬無し」がもっとも無駄のない変換であるのは言わずもがなです。
ここはちょっと込み入ってはいますが実現できないほどの難題とまでは言えないと勝手に考えています。

せっかくキャラ名の変換も考えたのですから、それとともに深く関連する事項としましては、
たっ君・海坊・源爺・エモやん・ヤンさん・メーガン妃・ベイダー卿・芭蕉翁・ナチ公・さや姉・プロシュート兄ィ・遠藤関・ホメイニ師・日ナレ生
…などのような尊称や役職、立場関係の呼称名詞接尾辞一般についても[属性ハ]-[属性イ]経由での遷移変換で狙い目通りに処理できればありがたいところです。
これらはどれも末尾要素に呼称語がついているのでアニメキャラ人名と同様特徴的ではないかと思われます。
「日ナレ生(にちなれせい)」についてはちょっと変換が難しそうですので、この前提案した「トランス音訓変換/パズルのピースをはめる変換」の方で対応するのもアリかもしれません。このへんは臨機応変にということで…。

さらにいえば
Y田さん・F川さん・H美 のようなアルファベット混在時のケースや
マリアっち・凛にゃん のほか○○ぴょん・○○たん・○○っぺ・○○りん
なども先述の延長上で実現可能かと思います。
何もこんなオタク根性丸出しの些末な変換に肩入れしてどーする、と思われるかもしれませんが単純に法則性に則ってバリエーションをちょっと足すようなものですのでこれも一種の「もったいない精神」のあらわれでありますのでどうぞご容赦ください。

再びキャラ名の変換について考察していきますが、「○○丸」とつくようなキャラ名には
剣獅子丸・爆烈丸・九十九丸
のようにカタカナではなく漢字が使われる例の方が優勢である場合もありますのでこのへんはここの止め字に応じた細かなチューニングが求められるかもしれません。
[属性ハ]-[属性イ]経由ときておりますので変換候補をずらずら出すためにはこのまま[属性イ]を続けて押下していくものなのですが、漢字パーツという文字列の特性上、目的の語にきちんとたどり着けるかどうかインターフェイス上の難点が懸念されるところではあります。
ここのところはまだ改善策が見つかっていませんので今後の課題としていきたいかと思います。

あとは世間一般の人名の止め字には
希/沙/穂/佳/哉/吾
などのようにある程度定型的な止め字もあるのですが、「美」や「菜」などのように音感/添え物的な止め字の類だけにとどめておいて前述のような"語彙的止め字"については適用を控え気味にしていった方が良いのか判断の分かれるところでもあります。
あくまで感覚的な分類ですし明確な線引きは決まってはいないのですが、気軽に創作駄洒落人名を作るのにはある程度タイピカルな「型」というのがありますのでその流儀に従うのであればある程度制限するのは仕方のないことかもしれません。

最後に人ならざる者の「人生」をあえてひねくり出したいときに
ニャン生・ワン生・犬生・魔女生・ロボ生
のように当て字をすることもありますがこの例はタイピカルな接尾辞というわけでもなさそうなので対応範囲に含めるべきなのかというのも本質論として浮かび上がってくると考えます。
属性ハの挙動性質の位置づけをもっと検証していくことが求められますね。今後もこのトピックは深掘りしていきたいところです。

以上でアニメキャラ名という切り口で入ったこの議論でしたが三属性変換の奥行きについて考えさせられた面白いテーマだったと思いました。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする