P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

独自方式キーボード刷新 ここに極まれり

2021-09-26 | ごあいさつ・お知らせ


(画像をクリックすると別タブが開いて拡大します)
【ペンタクラスタキーボード プロトタイプ図案】


ペンタクラスタキーボードの配列改善もこれで3回目だか4回目だかを迎え、拙ブログも日々コンセプトのアップデートを積み上げてきたところであります。
今回の改良はかねてから練っていたものであり新概念・新操作などを盛り込んで液晶パネルの横縦比率も16:10にしたものであり名実ともにブログ開始以来の大幅刷新となります。
これがおそらく最終形に近いもの(一応細かい修正などは今後もしていく予定)ではないかと見積もっております。

コンセプトの詳しい解説・改定はこれからゆっくりと煮詰めていきたいところなのではありますが
とりあえずはビジュアルだけでも皆様にお届けしてあれこれ想像してもらえればいいなーなどと考えております。
今までの探究・試行錯誤の集大成となるような構成に我ながら頑張ったなーとひとり悦に浸っているところであります。

図だけではちょっと説明不足でどんな機能になっているのかよくわからないと言われてしまうのも無理もない話でありまして
今記事中で全てをつまびらかな説明をするにはとてもボリュームが足りませんし材料も揃っておりませんので
とりあえず画像として皆さんに先行してご覧いただいて、そのうえでまだ懸案課題も残っておりますし最低限の更新頻度を維持しつつステップを踏みながらコンセプト解説記事を投稿していこうかと思います。
少々お時間をいただく見込みにはなってしまいますが読者の皆様には楽しみに待ってていただきたいと思います。

本日は9月26日、ワープロの日ということでこの記念すべき日に日本語入力の新たな挑戦となるような花火が打ち上げられたことを大変嬉しく思っております。
これからも日本語入力界隈、独自キーボード界隈のシーンがさらに盛り上がっていくことを願っております。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

アニメの訳語タイトル(英語&中国語)、要点だけ列挙

2021-09-18 | にほんごトピック

要点だけあげます。

 

【英語タイトル】
Skilled Teaser Takagi-san=からかい上手の高木さん
Attack on Titan=進撃の巨人
The Wind Rises=風立ちぬ
Higurashi When They Cry=ひぐらしのなく頃に
Demon Slayer=鬼滅の刃
Spirited Away=千と千尋の神隠し
ERASED=僕だけがいない街
Ghost in the Shell=攻殻機動隊
Love, Chunibyo & Other Delusions=中二病でも恋がしたい
Is the Order a Rabbit?=ご注文はうさぎですか?
Zatch Bell!=金色のガッシュベル


【中国語タイトル】
多拉A梦=ドラえもん
神奇寶貝=ポケットモンスター
新世紀福音戰士=新世紀エヴァンゲリオン
福音戰士新劇場版=ヱヴァンゲリヲン新劇場版シリーズ
火影忍者=NARUTO -ナルト-
蝋筆小新=クレヨンしんちゃん
灌籃高手=スラムダンク
魔法少女小圆=魔法少女まどか☆マギカ
偶像大师=アイドルマスター
我的妹妹哪有这么可爱!=俺の妹がこんなに可愛いわけがない
盜夢偵探=パプリカ
命运之夜=Fate/stay night


カテゴリはにほんごトピックとなっておりますがこれは外国語カテゴリですね(苦笑)
まあ日本語とのギャップを楽しむということで…。

あまり所感であるとかエピソードも特に持ち合わせていないので、このままコピペで終わらすのも何かもったいないので、苦し紛れに
【現在は発売終了・制限となっていて入手できない】惜しまれ商品を列挙していきたいと思います。
何の脈絡もなく検索エンジンにも受けが悪いかな~とは思いますがそんなのは気にせずフリーダムにやっていきたいと思います。


【惜しまれ商品リマインダー チョイ列挙】

・ミツカン クラウトザラートの素
・クレアおばさんのパンプキンシチュー
・森永乳業 リプトン 焦がしカラメルティーラテ
・コカ・コーラ 500mlPETサイズ
・おやつカンパニー HIKAKINプロデュース!!ベビースタードデカイラーメン(こだわりのチキン味)
・ファミリーマート ホイップクリームオニ盛りプリン
・セブンイレブン ふんわりメープルのパン
・セブンイレブン イカフライおかか弁当
・湖池屋 スコーン野菜爆弾
・ロッテ 霧の浮舟 チョコレート
・雪印乳業 宝石箱アイス
・森永乳業 100円みぞれアイス
・セブンイレブンのホットスナック 「からあげ棒」


反響が良ければ今回のやり方のような「列挙記事に添え物トッピングした雑想記事」を定例にしてリマインダ程度に話題を提供していきたいと思いますので良かったら見ていってください。
思いつきから3時間程度で作った記事ですがよろしくお願いします。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

サ変動詞のトンチキな誤変換をなくせ!

2021-09-12 | タッチ液晶部予測変換その他の挙動について

確立すると確率するの誤変換にはいい加減うんざりしますねー。(書く率なんてのもある)
コンピュータの漢字変換ソフトウェアでは、後ろに「する」を続けることができる動作性の名詞を「サ変名詞」「ザ変名詞」などに分類し、ユーザによる辞書登録時もこれらを指定できるものがある、とありますが
ペンタクラスタキーボードの品詞管理はちょっと変わっておりそもそも品詞分けを設定せずともでにをは助詞別口入力があるので格助詞の前にあるのは名詞ですよ、「でs」「だ」マーカーのついている前にあるものは何らかの用言だよ(名詞述語文を含む)、サ変活用形「し」のマーカーのついてあるものの前にはサ変的な用言がくるよ…というように個別の因子ではなく別口パーツ配置の具合をみて決定してあるものであります。
そのため、明示的に品詞というラベルを使うのは避けて、あえてそれをぼかした「よろづ」(イ万/ロ万/ハ万)という術語を使っています。

冒頭のようなサ変動詞がらみの誤変換はまだまだ無尽蔵にあり、以下に列挙しますが
本稿ではこれを入り口にさまざまな対処策を模索・考察していきたいと思いますのでよければお付き合いください。
()内が本意のほうの正しい変換であります。


先生する(先制、宣誓)
容易されており(用意)
師弟する(指定)
状況する(上京)
内臓する(内蔵)
確率されておらず(確立)
多様される(多用)
多様して(多用)
傘下する(参加、酸化)
帽子する(防止)
軽快している(警戒)
関心します(感心)
高速され疲れますよね^^;(拘束)
俎上する(遡上)
快哉する(開催)
大化する(退化)
高尚する(交渉、考証、公称、口誦)
好例する(降霊)
格子する(行使)
雑草する(雑想)
糖分する(等分)
服装する(副葬)
天球する(転厩)
故事する(固辞、誇示)
反故する(保護)
習慣する(収監)
仕様して(使用、飼養)
重体する(渋滞)
妖怪する(溶解)
階段する(会談)
補色する(捕食)
最高神しても(再更新)
背信してる(配信)
童謡する(動揺)
痩身する(送信)
手荒いする(手洗い)
城址する(上梓)
航海する(後悔)
天災する(転載)
債権する(再建)
東洋する(盗用、登用)
名言する(明言)
親切する(新設)
蓮ちゃんする(連チャン)
気性する(起床)
最下位する(再開、再会)
覇権する(派遣)
兆候する(長考)
栄光する(曳航)
害虫する(外注)
閃光する(先行、選考、専攻)
決勝する(結晶)

上記のようなサ変絡みの誤変換においての問題原因は

1.ユーザーが細切れで入力しているがために[語幹部分]と[--する]の部分の連携を活かせずに個々で変換されているため起こる誤変換
2.かな漢字変換IMEに不備があって品詞ベースの形態素接続規則(品詞接続表)がうまく機能していない、またはそういうアルゴリズムを採用していない
3.辞書データや学習結果により悪例のほうが許容集積されノイズとして残ってしまっている

などの要因が考えられるかと思います。

-------------------------------------------
ペンタクラスタキーボードの入力機構においてサ変動詞のさばきはどのようにしているかというと
・サ変動詞連用形「し」については別口入力マーキングが付随しており解析上サ変検出の標識となって判別材料となっております。
・未然形については込み入っていて、
aし(-ない、-よう)については別口入力の「し」でマーキング、
bせ(-ず)、cさ(-れる、-せる)
については別口入力は付随せずべた文字列からの解析推定でサ変部分を検出します。(扱いが統一的でないのはご理解ください)
・終止/連体形(する)については予測変換を手元の液晶で提示し、変換の混線を回避する方策とします。予測変換を用いない場合はべた文字列解析です。
・仮定形(すれ)については同じく別口入力は付随せずべた文字列からの解析推定でサ変部分を検出します。
・命令形(しろ、せよ)についてはこちらも込み入っていて
aしろについてはちょっと違和感ありますが[し]ろ、と[し]の部分を別口入力で、ろはべたの文字列で入力してください。分解能を高める為ですのでご理解ください。
bせよについては別口入力は付随せずべた文字列からの解析推定でサ変部分を検出します。(扱いが統一的でないのはご理解ください)

とまあまだまだ模索中でありますがさすがにすべての活用形に応じて個別の別口入力を作るわけにはいかないのでこのようなモザイク含みの様相をお許し下さるよう重ねてご理解申し上げます。
割り切って言ってしまえば、「し」がらみの活用だけは別口入力で、それ以外の活用はべた文字列で御慣熟していただき、
使用場面の多い終止形・連体形「する」については液晶予測入力の手段も用意してある――これは補助的なおまけぐらいに考えておいてください。

このモザイク含みの統一的でない処理体系には異論もあるかもしれません。
ロジックを策定するP陣営側にとっても動詞とその活用形をとり回す規則のメンテナンスの面からいって常道から外れすぎているとのご批判も受ける事かと思います。
しかし私としましても決して場当たり的に散漫なルールを作ったものではないのであります。
別口パーツ「し」につきましてもこの単文字は誤変換誘発対策の帰趨を決める重要な勘所でありますし
取ってつけたかのように見える液晶パネル予測入力にしましてもこうしてサジェストできる活用形を限定することによって過剰な提示候補を絞れることにもなりますし何より連体形の方は後続に続く予測ワードの提示が流れを中断せずに継次的に表示できますので頻出動作として理に適っております。
これは連体形・連体修飾だからできることであり規定チャンクは一種のクリシェとして予測可能性の高い語句の並びになっていくことが経験的に分かっているところからくるものであります。
これが連用形・連用修飾であった場合にはそうはいきません。後続にくる用言は展開を急転させるうっちゃり力をもっているので先の予測が容易ではありませんし候補提示数も横溢してきてしまいます。
なのでこれはこれでマーカーを要求するに足る手当てが必要になってくるのです。単に「し」というリテラルだけを見るのではなく連用形形態素は後続が予測/解析しづらいという文法的傾向・語彙的傾向も加味した立体的な組み立てとなっているのであります。
しかも連用形には連用中止法というややこしい用法がありましてこれが読点なしで使われてしまうと
○近く市場調査を行う
×知覚し冗長さをおこなう
のような誤変換が起こってしまいかねず、べた文字列ではだかのサ変「し」をタイプしてしまうことの結構なリスクを無視できないものとなっているのです。
このように要所要所で分解能を制御する粒度調整が必要になってきています。
残りのべた文字列で解釈する各種活用形には、用法に固有性があって過去の助動詞を好む動詞、受身使役を好む動詞、仮定形を好む動詞など全部が全部とは言いませんがコロケーション学習・用例学習の効果が期待できるもの(先行される/専攻したなど)が多く見受けられる面もあるので個別のケースで対処していけば良い、との目算もあります。

なお、昨今取りざたされている「接種」と「摂取」の誤変換につきましては、これは一応サ変動詞各々の用法の使い分けの問題であり前段のような品詞素性の違うワードがサ変動詞変換に侵食してくる事態のケースとは別物の懸案でありますので、これはこれで別記事でのちのち触れていければよいと思っております。
今は品詞に則した厳格な分類ではなくゆるい制約の「よろづ」という概念を使って「サ変動詞」「サ変名詞」「サ変動詞っぽいもの」「名詞であるが無理くりサ変を付加できなくもないもの」などなどの境界領域を泥臭くではありますが上手く束ねて、
各種の入力ヒント:以下のモノ

・別口入力「し」のマーカーがあればあるに越したことはない
・「する」形は予測入力で液晶パネルから
・「した」は[し]た と厳密に[]別口入力マーキングをして
・「せず」「させる」「される」「させず」等は衝突する解釈も少なそうであるしある程度長尺なので楽観視
・「しろ」は白、城 との衝突も懸念されるのでここは厳密に[し]ろ と[]別口入力マーキングをして
・「せよ」は衝突もないのでべた入力で楽観視

のように、くり返しにはなりますが設計の骨格となる重要なインターフェイスですので何卒お含みおきください。(大抵の結合はよろづロ万の属性づけに+サ変活用がついたものであるとシンプルにとらえる視点です)
ネガティブにとらえると整合性のない、モザイク含みの、パッチワーク的な 頼りないインターフェイスと見えてしまわれるのかもしれませんが、
物は言いよう、「ベスト・コンビネーション」「アンサンブルの変換」「立体的粒度のさばき方」
と、好意的に受け取ってもらえれば幸いであります。

こうしてみますと、タッチ液晶操作まわりの作り込み、インターフェイスの精緻化が新たな課題としてあがってきたようでありますね。
今回はこれ以上の深掘りは諦めて次回以降に取り組んでいきたいと思います。
ちょっとだけメモ、忘れないように骨子だけ記しておきますと、

液晶予測入力で入力した確定文字列はディスプレー由来通常インターフェイスでの確定の時よりも辞書学習の重みづけが強くなるさじ加減をおこなう。
理由は予測候補は文脈全体を商量して決定するディスプレー由来入力とは違い
タッチパネル由来入力は入力文の直近の単チャンクフレーズ専用の視界での変換候補が提示されるのでより解釈の限定性を帯びている。
すなわちサ変チャンクならサ変チャンクとして決め撃ちしたうえの下ごしらえ済みの候補が定型的に選択・決定されるので
諸所の事情の込み入った解釈空間を必要とするディスプレー由来入力のもつややこしい事情に付き合わなくてもよいからである。

…今はちょっと言葉足らずでうまく噛み砕いて説明するのはやめておきますが、ここらあたりをもっと考察していって次回以降の掘り下げに向かっていこうかと思います。

あっっ!大事なことを忘れていました!!

今回の記事を期に新カテゴリ・「タッチ液晶部予測変換その他の挙動について」
を設置しました。今後も記事製作に励んでいきたいのでみなさまどうぞよろしくお願いします。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ちくわパン 打線組んだよ リテラシー

2021-09-11 | にほんごトピック

読みと表記が一致しない(しそうにない)以下の語例は、
果たしてテキスト音声読み上げソフトでどうやって読むのか…

1 中 民安ァ
2 ニ とゅふもと
3 遊 大した奴ェ
4 左 絶っっっ対
5 一 ドラァグクイーン
6 三 探索者ェ
7 捕 うっせえわェ
8 右 ひぅまんへるすけあ
9 投 ツィーョ


今回もタイトルは飾り(以下略)であります。
申し訳程度に言及しておくと
ちくわパンはJR東日本系列のコンビニNEWDAYSで入手できるそうです。
列挙仕立ては打線風にしてみました。
あとはテキストトピックなのでリテラシーです。

素朴な疑問というか、今回のはチョイ記事です。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ワープロの日を前にしてちょいバズり

2021-09-09 | ごあいさつ・お知らせ

画像
[主水、ワープロをうつ]

 

ここ1週間くらい、ワープロ記事の検索流入がやけに多いな…と思っていたら
NHK BSプレミアムで9月7日にプロジェクトX・ワープロ回の再放送がやっていたのですね。
かな漢字変換という概念を世間に周知させた画期的な開発物語であったと思います。

当ブログでも感想・レビューカテゴリ
において日本語入力のトピックで取り上げており、地味にアクセスを頂いていた記事ですので感謝の念とともに感慨深い思いであります。
とりあげた記事リンクは

貴重な映像資料 日本語ワープロ誕生の秘話 - P突堤2
   (こちらのアフィリエイトはDVDパッケージのもの)

9月26日は「ワープロの日」 - P突堤2
   (こちらのアフィリエイトはKindle電子書籍版のもの)

となっております。

今月も「ワープロの日」が近づいてまいりましたので取り急ぎ過去記事の宣伝とそれも兼ねて技術者たちのロマンに思いを馳せたいなと思います。
思えばあの頃は、参入各社も百花繚乱で市場の熱量もヒートアップしていて面白い時代でしたなあ。

ついでに言えば、かな漢字変換の仕組みも大きく変わってきておりスマホ向けの日本語入力などはまた別の操作体系があって新展開・新展望をあたえてくれますね。
それらの影響なども十二分に受けながら、今後もペンタクラスタキーボードのコンセプトを磨いていきたいなと思います。
(突然の思い出し)日本語入力FEPの雄であった松茸にちなんで、今年の秋こそはマツタケが食べたいなー。
なんて、ずいぶん前に「やっぱり松(ver.5)が好きっ!楽しいワープロ便利帖/酒井昭伸」という本を買ってあったんだけどどっかいっちゃいましたねぇ。
いずれ書評を書きたいなとも思っていたのですがそもそも在庫がないから後ほどのお話になりそうです。

…それでは、推奨BGMは「9月の海」(具島直子)で♪締めさせていただきたいと思います。
哀愁を帯びたメロウな曲調でしっとりとした気分になれるので、ぜひ検索してみてください。

皆さんにとって滋味豊かなネット生活が送れますように。秋だよ秋。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする