dak ブログ

python、rubyなどのプログラミング、MySQL、サーバーの設定などの備忘録。レゴの写真も。

python でひらがな⇔カタカナの変換方法とひらがな・カタカナの判定方法

2021-01-23 12:31:32 | python
python でひらがな⇔カタカナの変換方法とひらがな・カタカナの判定方法のメモ。

ひらがな⇔カタカナの変換、文字種の判別は、両方とも wanakana で実現できます。
wanakana は以下でインストールできます。
pip install wanakana-python


ひらがな⇔カタカナの変換は to_xxx() を使います。
import wanakana
wanakana.to_katakana('あア亜')
==> 'アア亜'
wanakana.to_hiragana('あア亜')
==> 'ああ亜'

ひらがな、カタカナ等の文字種の判定には is_xxx() を使います。
import wanakana
wanakana.is_hiragana('あぁー')    # 「ー」は、ひらがなと判定される
==> True
wanakana.is_hiragana('あ・あ')    # 「・」は、ひらがなとは判定されない
False
wanakana.is_hiragana('あア亜')
==> False

wanakana.is_katakana('アァー')  # 「ー」は、カタカナと判定される
==> True
wanakana.is_katakana('ア・ア')   # 「・」は、カタカナと判定される
==> True
wanakana.is_katakana('あア亜')
==> False

wanakana.is_kanji('亜阿吾')
==> True
wanakana.is_kanji('あア亜')
==> False

「・」はカタカナでの人名表記の際に姓名の区切り文字として使われますが、
その用途を考慮してか「・」は is_katakana() で True と判定されます。

この記事についてブログを書く
« web ページで pdf ファイルを... | トップ | 画像形式の判定方法 »

python」カテゴリの最新記事