P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

別口入力キー候補[し]の補足追記

2018-02-28 | 別口入力にまつわる諸問題
別口入力候補・「サ変動詞」あるいは「五段活用動詞のうちサ行のもの」を対象とした入力では「解決する」「ハグする」のような構成語句と「する」が+直結に接続した典型的なサ変動詞のものもありますが、
「球拾おうとし川転落」「書いては反故にしを繰り返した」「設計を容易にしコストを削減する」「憎まれ役を母がし大苦労」のように ~とし、~にし、~がし のように格助詞を挟んでスプリットに「し」が遊離しているものもあります。
これらはイディオム化した言い回しの文字の並びではありますが繋ぎをもたらす動作句にこれといってかかることなく「カレーにし」「スマホにし」のように単に選択・意志をあらわす用で「し」が使われている例もあります。
こういったものでも適切に解釈して判断することも重要ではありますが、単独の「し」のためにわざわざ別口入力を必要とするのも少々面倒かもしれません。しかし後続の文字の連なりによっては誤変換を誘発するかもしれませんので識別は大切です。

サ変動詞の活用形のうち「し」に関するところだけに適用しようと目論むこの別口入力[し]ですが、「し」ひとつとってもさまざまなローカルケースが考えられます。それらへの対応を文法的・語彙的な背景を考慮しつつ整理し入力の仔細を確立していかなければなりません。
これら「し」に続く語句は機能語や用言、接辞などさまざまな接続をもっておりこれらを概観的にではありますがにわか仕込みに整理しましたので挙げてみたいと思います。

(1)して、した、します、したい、しよう などのような動詞の基本変化形バリエーション
→まず背景知識として「する」に接続する助動詞を考えますが、ここでの場合は動詞の基本変化形としても捉えるものとします。
いろいろありますが(らしい)(ようだ)は終止形(する)からの接続なので除外し、ここで問題にするのは未然形(し)あるいは連用形(し)から接続するもの↓(以下に挙げる)を把握しておきます。
・丁寧の助動詞(ます)
・推定・伝聞の助動詞(そうだ)
・過去・完了・存続・確認の助動詞(た(だ))
・否定の意志・推量の助動詞(まい)
・意志・推量・勧誘の助動詞(よう)
・否定・勧誘の助動詞(ない)
・希望の助動詞(たい・たがる)

…まずすぐ気がつくのは[し]-[て]、[し]-[た]などのように別口入力が連続するケースは煩雑で[し]と[て][た]は折り合いが悪いです。2つが背反する存在であることがうかがわれますし検討中の別口入力[た]の採用にも影響を及ぼす微妙なファクターであると言えます。
解決策は考慮中です。その場しのぎですが <して・した> などは末尾の[て][た]に集約して[し]は随伴せずにさせてしまおうかと考えています。(もしくは[た]は不採用前提で)
次に「たい」「ない」については連体修飾語を形成する可能性があるので考慮が必要です。以下例として
(例)×内容を理解したい王子には十分に注意 ○内容を理解し対応時には十分注意 (財団法人 日本漢字能力検定協会「漢検“変漢ミス”コンテスト」)が挙げられます。
これは適用文字列のスコープ「し」-「したい」の齟齬からきています。 同様に「し」-「しない」でも齟齬がありうると考えられます。
共通するのは形容詞型助動詞だということですがこれに連体修飾がついてまわるのが本質的な問題です。
こちらも解決策は決まっておりませんが安易に「したい」の方をオミットすればよいというものでもなく、「…死体」との弁別が役に立つ場面もあるかもしれませんので答えは出ていません。

(2)し終わる、し倒す、し損ねる、しまくる、し通す、しあぐねる、しにくい、しやすい、しそうだ (複合動詞あるいは+補助動詞/助動詞との接続)
→これらは--氏、--死、--市、--誌などの接尾辞のものとの区別に役立ちそうです。ただ「与しやすい」「通し損ねる」のような五段動詞-補助動詞もコンパチブルにするのを認める場合はどんな副作用が起こるのかをまだ見極めてはいません。
ただサ変動詞「し」から構成する複合動詞に比べて五段動詞が構成する複合動詞の方がどことなくひとかたまりでの一体感が感じられるので(感覚的なものですが)いちいち別口入力[し]を打鍵せずともべたのままひと続きで打ちたいと感じるのが自然な感覚ではないでしょうか。
なので複合動詞あるいは+補助動詞/助動詞との接続の場合の別口入力[し]はサ変動詞に限るというのがここでの暫定的な方針としたいところです。

(3)しつつ、したり(古典での完了の助動詞/断定の助動詞「たり」とは別物)、しながら、しがてら(接続助詞との接続)
→これらは数も限られていますし境目の混同しそうな文字列の並びでもなさそうなのであえて[し]での別口入力を付随させることもないかと思いますが、だからといって[し]をオミットするほどの積極的な要因材料もある訳ではないのでまあ別口入力[し]を受け付けてみるということで様子を見てみたいと思います。
文の特質によって別口入力[し]の入力を忌避する場面というのは何らかの不都合が原因になっていてのことですから、不都合の生じないところではあえて脱入力にこだわることもなかろうかと思いますし特殊例外というのはやたらと増やすべきではないので通常どおり[し]を受け付けます。
ここでも五段動詞への対応の必要性は特に感じないのでサ変動詞だけに限るという方針でよいでしょう。

(4)しっぱなし、しがち、したて、し放題、しどころ、し甲斐、し応え、し際(接尾辞によるモダリティ・アスペクトの付加あるいは複合名詞化)
→いわば広義の形容詞(様態・状況)のようにはたらくものもあれば、複合名詞化してひとつの体言となっているものもあります。
こちらのほうは種類も結構ありそうですし「し」の弁別には役立ちそうですから別口入力で識別するのが妥当かと思います。
五段動詞への対応はこちらもナシということでよいでしょう。むしろこの場合はコンパチブルにしたせいで五段動詞と競合するのを避けた方がメリットがあると思います。

(5)しさえすれば、しこそすれ、しもしない、しなどはしない(副助詞との接続)
→これは文としてよく考えると機能性に特徴のある成分だと思うので文解析上は特段の解釈が必要かもしれません。ただ文字の並びのうえにおいてはそれほど厄介なものではなさそうです。
「し」の前後境界付近では「も」「は」などの助詞につながるか(一文字語はほぼ別口入力からのものということ)あるいは二文字以上の副助詞「さえ」「こそ」「など」につながるケースが絶対多数であると思われるので、誤変換の起こりそうな要素は少ないのではないでしょうか。
五段動詞への対応はあってもなくてもよいです。今のところ何か悪さをしそうな要素は見受けられませんが、適用範囲の統一感を出したいのであれば五段動詞対応せず、でよいでしょう。


…以上で[し]に後続するさまざまな接続の細かな考察をおこなってきましたが一番頭を抱えそうなところはやはり[し]-[したい]、[し]-[しない]の競合での誤変換を避けるためにこの場合に限りどちらか一方をオミットするのが得策なのかの判断に迷うところです。
できれば「~し」で区切れるものならばそこで確定させたいですしわかりやすいとは思うのですが「したい」「しない」のときだけ別口入力をオミットするというのもユーザーがなかなか意識しづらいというのもありやはり特例措置はなかなか導入するところまでには至らないというのが正直なところです。
結果として「~し対応時」や「~し内容量」などの「『し』切れ」の文字列の変換が優先されて、もしもの場合ですが「~したい王子」や「~しない容量」のほうにしたいケースでは意図した変換を出力する手立ては失われることになります。かわりに語彙や共起用例などから推測してカバーするといった措置が二次的に動作することが望まれるのですが、思った通りに機能するかは未知数です。

あとはさ行五段動詞を別口入力に適用するとしたときの細かな不具合の可能性ですが、これは考察していってきた中でそんなに必須のものでもないな…ということが薄々わかり始めてきたのでサ変動詞との競合を避けるために積極導入は控えることで解決する問題だと思います。
当初描いていた「サ変動詞-さ行五段動詞コンパチブル」の別口入力の看板は下ろして、五段動詞の適用を限定的に認めた形の「便利キー・[し]」のフレーズの方が実態をあらわしていて良いかと思います。
もちろん「長押し⇔長尾氏」の区別を助けるために[し]のマーキングを利用するといった例もあるのでこれら局所的な事例をもっと探さなければいけませんが適切な使いどころでは五段動詞での適用も忘れずに維持していきたいところです。

---

さてここまで「し」が先行する場合のケース分けについて突っ込んだ考察をしていきました。では「し」が終端にくる場合ではなにか重要な議論対象はないのかというと、大事なものがありました。
それは接続助詞のときの「し」です。これには「準備はしたし、予約もしたし」…のような"並列"の用法と、「寒いし、こたつに入ろう」のような"理由"の用法などがあります。
これらはサ変動詞のものとは性質がまったく異なるので別口入力で同列に扱うのもためらわれるかもしれませんが、「し」という文字列に特に着目した「便利キー・[し]」という枠組みであればなんら受け入れがたいところもありません。
すでにある別口入力「が」が格助詞としての用法だけではなくて接続助詞の「が」も兼任していることからわかるようにそれほど唐突な話でもありません。
「し」はさまざまな誤変換の温床となる語片ですが異なるチャンネルのものでも変換のヒントになるものが増えるのはそんなに悪い話でもないのでうまく活かしたいところです。
例えば「古いし⇔古石」「低いし⇔引く意志」などの使い分けに重宝する場面もあるのではないでしょうか。
あとは「間違いだしね⇔間違いだ死ね」も使い分けられて便利ですが[隠し]-[書くし](五段動詞付随の「し」-末尾+接続助詞「し」)のように競合してしまうケースもあって何とも言えない場合もあります。
こちらでも間違いを防ぐために五段動詞付随での別口入力[し]の適用は避けた方が良いでしょう。もっと突っ込んで考えますと、「研究しし」のようにサ変動詞(語尾し)+接続助詞「し」のケースは不自然ですので考えられません。
どうやら接続助詞「し」への接続は終止形からのようですのでサ変動詞の場合「研究するし」のようなものが典型的な接続ということになります。
おそらく多分、[サ変動詞付随の「し」]-[一般動詞語尾付随の接続助詞「し」]の競合による不具合はすぐには挙げられないか、あっても非常にまれなケースだと思います。

---

…以上で別口入力キー候補[し]の補足をまとめていったところですが、別口入力[し]の使用はこういった細かな注意点を意識しつつ利用していくのが求められると思うので採用にも幾分ハードルがあるかと思います。
しかしユーザーにも理解度を求めるありかた・わかり合える関係のうえで機能を使っていくことが標準になっていくとすればそれはユーザー側と提供者側との理想的な関係であるともいえます。
そういったものがもし満たされるのであれば多少ややこしいですが隅々まで経絡の通ったユーザー体験ができると思いますしインターフェイスを見つめなおすうえでポスト最適解になるのではないかとも考えたりもします(希望的観測ですが)。

前記事からの懸案事項として別口入力[し]の位置づけを「さ行まわりの動詞のための別口入力」とぼやかした言い方にするか、いっそのこと「便利キー・[し]」としてしまい文法的背景から離れた名称にすることもあわせて検討していきたい…としてきましたが、
これは今回の検討の結果「便利キー・[し]」というのを導入フレーズにするのが適当ではないかと思います。五段動詞の重要性は薄れましたし、接続助詞「し」の用法もあるのでごった煮的なこちらの名称を推します。
なにより動詞活用のバリエーションよりも「し」という語片そのものにこだわって用立てた別口入力ということでこの「便利キー」という概念はぴったりのものだとあらためて感じました。

2回にわたって掘り下げていった別口入力ですので、ユーザーへの周知とさらなる細かな分析の課題をクリアできれば、新別口入力候補としても有力であるかと思います。




  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

未定義③キーにあてる別口入力キー候補その3…[し]

2018-02-10 | 別口入力にまつわる諸問題
これまでの別口入力の存在目的はもっぱら文法上の区切り明確化を見据えてのことで導入したものが大半であります。
「でにをは」などの助詞にしても「だ・です・ル形動詞」のような語尾成分にしても何か特定の言い回しに向けて用意したものではなくあらゆる接続のパターンでも本質的に変わらない文法上の機能を物差しにして入力文を形成していく骨格になっているものでした。
(まあル形動詞別口入力に関しては若者ことば「--る」に的を絞っているので特定的かもしれませんが今回の趣旨に沿うものとして捉えてください(苦笑))
しかし別口入力の考察・議論も進んできてさらにその可能性を探っていこうということになると、入力時に頻出しそうなローカルケース…個別的な細事が障壁となって正しい変換を妨げるネックとなるような事象が思ったより多くみられることが往々にしてあるということに直面させられるのです。
今回の提案ではそういった問題に対処すべく文法的基準からの枠組みから少し離れて、特定の語彙・語句への対応に的を絞った新たな方向性の別口入力について検討していきたいと思います。

今回検討していきたい別口入力候補はサ変動詞あるいは五段活用動詞のうちサ行のもの…の連用形[し]です。
「し」は動詞使いでのもの以外にも語中・語頭・語尾を問わずとにかく日本語の文章には頻出する要素であり誤変換の温床・宝庫となっている張本人(?)でもあります。
--氏、--死、--市、--誌などのように同音異字の種類がとても多くて三属性変換-属性ハ(接頭語・接尾語の変換)で接辞がらみのものは一応選択/変換できる手立ては用意してあるものの、[通常変換]では属性に着目していないものなのでうまく変換できない場合も十分考えられます。
今回の提案は端的に言い切ってしまえば、これら「し」の接尾語要素のからむ誤変換にピンポイントで対応して別口入力を立ててしまおうとのねらいで考え出されたものであるといえます。
個別の接尾語弁別のためにキーを使い分けるのは非現実的であるので、別口入力は動詞活用の一形態の「し」をマーカーとする入力要素としました。
--氏、--死、--市、--誌などを指定して操作させるのはむずかしいので不変化部分のかな文字「し」を使っていこうということで、いわばできないのなら対岸から攻めていこうという作戦ですね。

乱暴に言ってしまえば数あるかな文字のなかで特に「し」のためだけに新たな別口入力を作ってしまおうという馬鹿正直な方法ですが、これがなかなか素朴にして効果的な対策案だと言えるのではないでしょうか。
環境によって変換に違いがあるかとは思いますが例えば変換 ふしんし:(不審死)・(腐心し/普請し) を使い分けるのに役立つかと思われます。ふしん[し]と入力したときは[腐心し/普請し]の方が提示されるといった具合です。
同様に さくしの場合:(佐久市/作詞/策士)・(裂くし/咲くし) の2グループに分かれます。あつぎし:厚木市・厚着し の場合も同様です。
別口入力[し]のはたらきで、変換候補提示に迷う場合でもまず動詞活用形「し」の語句のものは明確にコンピュータが把握しているので解釈の負荷が大幅に減り候補提示も解析上は動詞連用形のものはすでに省かれ済みという前提として捉えられるのでより適切な語句を絞れるという構造になっています。

さらに別口入力[し]の効用として「漢語一文字+し」からなるサ変動詞の区別に威力を発揮するのではないかという推断もあります。
例えば、以下のようなサ変動詞が挙げられます。
察し・奉し・辞し・期し・課し・比し・際し・滅し・有し・賭し・逸し・称し・呈し・祝し
べたのかなで2文字あるいは3・4文字しかないこれらの語句は、周辺文字列の配置によっては当然誤変換に左右されやすいデリケートな文字列ですが、この別口入力を導入することにより実に効果的なマーキングを施すことができます。

もちろんサ変動詞の活用形は
(未然形)「し-ない」「し-よう」「せ-ず」「せ-られる」「さ-ず」「さ-れる」等
(連用形)「し-ます」「し-た」「し-たい」
(終止形)「する」
(連体形)「する-とき」
(仮定形)「すれ-ば」
(命令形)「しろ」
のように「し」で始まるものばかりではありませんのでカバーできる言い回しは未然/連用/命令 形のところだけですが場合によっては命令形のところの([し]ろ)と打ち込むようなものはいささかぎこちなさも感じるので別口入力をあえて要求しないということもあるかもしれません。
なので[し]にからむ入力の場面は限られてしまうかと思われますが、冒頭の--氏、--死、--市、--誌などの接尾語「し」と明確に区別できる効果は大きいのでそれなりのメリットはあるかと思います。
とはいうものの未然形の「せ」「さ」に対応できなかったり、頻出と思われる「する」にも対応できていないという面で何か物足りないとお感じの方もおられるかもしれませんがさまざまな事情がありあまり幅広くサ変をこなすことは期待できそうにありません。
ワイルドカード入力で「し-せ-さ-する」等を近隣文脈から推測して適宜解釈させればよい、とも考えましたが、「--し」でひと区切りつける連用形中止法の用法もあって終端部の「し」と同じく「する」が競合するためうまく解釈できなさそうなので気が進みませんし、
それができないとなると「する」抜きで「し-せ-さ」だけワイルドカードさせるものなんだか収まりが悪い気がしてくるので別口入力「し」は用途限定の非ワイルドカード別口入力としたほうがシンプルだと思います。

こんな事情もあって「し」一点突破の別口入力はもっぱら「し」の同音語片対策の色彩が色濃くなっているのですが、先程チラッと話に出た連用中止法がらみの誤変換には有効な対策として切り込んでいけると踏んでいます。
連用中止法とは、「よく学び、よく遊ぶ」や「眠気があり、運転できない」などのように連用形で叙述を一度中止して、他の語と接続することなくまた続けていく用法のことで活用形テ形とほぼ類似しており代替も可能でありますが連用中止法の方は文中に複数回使えるなどの違いがあります。
当然サ変動詞においても連用中止法はよくみられるものなのですが、有名な誤変換「ちかくしじょうちょうさをおこなう→知覚し冗長さをおこなう」(ATOK 2007)のように句読点を挟まずにすぐ後続文が続くときなどはこの「し」のケースでは特に顕著に誤変換がみられるのです。
このような例には別口入力[し]によるマーキングが有効ですし、さらにちょっと無理やりですが「歴任し長ずる⇔歴任視聴ズル」/「兼任し生じる⇔兼任師匠汁」のような文の区別に役立つといったこともあるかもしれません。

しかし注意深く見ていくと別の面では問題もあります。
例えば「長押し⇔長尾氏」のような使い分けは一見別口入力[し]をうまく使って事なきを得たかのように見えます。しかし「長押し」はこれひとつで連用形転成名詞ですので文解析上の扱いは名詞になるところなのですが、これがまかり通るとなると「串刺し」や「手のひら返し」などのような意識せずとも自明の名詞までいちいち別口入力[し]を付加しなくてはならないのかという問題が出てきます。
ケースバイケースで変わってくるとしたらその境界条件は何なのか基準が明確ではない事態が懸念されますし、それよりも根源的な事なのですが「押し」はサ変動詞ではなく五段動詞なのでこれを説明するためにすこしややこしい状況なってくるのです。

そもそもサ変動詞の中には「愛する」(サ変動詞)が「愛す」(五段動詞)と混在したり「課せられる」が「課される」のような近年変化の途上にあるものなどがありサ変動詞の五段動詞化がすすんでいる状況です。
そこへきて今回の別口入力はまだ模索中ですから単純にサ変動詞ばかりだけではなく五段動詞のさ行のものへも適用するとなると全てをきちんと精査しているわけではないのでどんな副作用が起こるのかを見定めることができてはいません。
ましてや「し」「せ」「さ」が揺れている中でワイルドカード解釈させていこうというのはやはり無理というものでしょう。

かといって単純にサ変動詞のみを別口入力適用対象に絞る、とするのも性急すぎるような気もします。
五段活用動詞では同じ用言属性の属性ロであっても通常変換では見分けのつきにくい例(マシ/増し)のように役立ちそうな例も見つけられますが、
逆にサ変動詞と五段動詞が競合してかえって混乱する事例(怪我し/汚し)のようなものもあったりします。
ただ「長押し⇔長尾氏」のように五段動詞でありながらも弁別に役立つものを排除するのは惜しいですし競合するケースでも次点の変換候補で選択・提示していけばいい話なので語彙的なところは上手く捌いていければ良いかなと思います。


…以上、長々となってしまいましたがそのほかに吟味すべき点も多々あり今記事だけでは収まりそうもないので[し]に関しては<補足>として近く追記事をあげていくつもりです。

なお[し]は別口入力候補として「サ変動詞」あるいは「五段活用動詞のうちサ行のもの」と謳ってはおりましたがどうも個別のケースでは[し]でのマーキングが適さない事例もありそうなのでサ変/さ行五段動詞コンパチブルであるのはあまり前面に出さず、
ざっくりと「さ行まわりの動詞のための別口入力」とぼやかした言い方にするか、いっそのこと「便利キー・[し]」としてしまい文法的背景から離れた名称にすることもあわせて検討していきたいかと思います。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする