python でひらがな⇔カタカナの変換方法とひらがな・カタカナの判定方法のメモ。
ひらがな⇔カタカナの変換、文字種の判別は、両方とも wanakana で実現できます。
wanakana は以下でインストールできます。
ひらがな⇔カタカナの変換は to_xxx() を使います。
ひらがな、カタカナ等の文字種の判定には is_xxx() を使います。
「・」はカタカナでの人名表記の際に姓名の区切り文字として使われますが、
その用途を考慮してか「・」は is_katakana() で True と判定されます。
ひらがな⇔カタカナの変換、文字種の判別は、両方とも wanakana で実現できます。
wanakana は以下でインストールできます。
pip install wanakana-python
ひらがな⇔カタカナの変換は to_xxx() を使います。
import wanakana wanakana.to_katakana('あア亜') ==> 'アア亜' wanakana.to_hiragana('あア亜') ==> 'ああ亜'
ひらがな、カタカナ等の文字種の判定には is_xxx() を使います。
import wanakana wanakana.is_hiragana('あぁー') # 「ー」は、ひらがなと判定される ==> True wanakana.is_hiragana('あ・あ') # 「・」は、ひらがなとは判定されない False wanakana.is_hiragana('あア亜') ==> False wanakana.is_katakana('アァー') # 「ー」は、カタカナと判定される ==> True wanakana.is_katakana('ア・ア') # 「・」は、カタカナと判定される ==> True wanakana.is_katakana('あア亜') ==> False wanakana.is_kanji('亜阿吾') ==> True wanakana.is_kanji('あア亜') ==> False
「・」はカタカナでの人名表記の際に姓名の区切り文字として使われますが、
その用途を考慮してか「・」は is_katakana() で True と判定されます。