こんにちは。フォックス淳子@元・図書館業界のブラックジャック(「資格はないが腕はいい」と言いたいらしい)です。かつては、それで紀伊○屋書店で随分稼がせてもらいました。
[china 6191] ピンイン分かち書き
> *****
確かに日本の図書目録法では(何種類かあるので絶対ではありませんが)、「日本語に対しては」分かち書きの規則があります。例えば、上の税所さんの文章を「図書目録用にわかちがき」すると:
ニッポン デ ガクジュツ ロンブン ノ ブンケン データベース
という風になります(システムにより「ニッポン」「ニホン」どちらかで統一したりしてヤヤこしい) が、「分かち書き」というのは、データベース作成上は、実は余り意味がありません。何故なら
1 索引を作るなら(分かち書きの有る無しに関わらず)頭からベタ読み
2 そうでないようなデータベースの場合、元々、図書目録法のような厳密な規則は存在せず、例えばインターネットの全文ロボット検索のような「抽出」検索になるので、分かち書きの意味はない
のです。
ただ、図書館業界というのは非常に特殊な世界なので(笑)ひょっとしたら中国にはあるかな? すいません、私、香港に来た時、まさにその業界に就職しようとしてたんですが、いかんせん中国語が出来ないもんで敢え無く惨敗、今に到るまでわかりません。でも想像するに、図書館業界のピンイン表記と言うのは、要はアルファベットと併せて並べるために存在するものであると思われるので、世界で一番通用している米国会図書館の規則に従っているのではないか?と思います。但しこの場合も「分かち書き」に関しての厳密な法則はありません:
ALA-LC Romanization Tables
Chinese
4. Word Division
Each character is romanized as a separate word.
Exceptions:
1) The romanized parts of multicharacter surnames and given
names are hyphenated.
2) The romanized parts of multicharacter geographic names are
hyphenated when these names appear in titles oras part of
corporate names (except for geographical generics, which
appear as separate words).
(参照:ALA-LC romanization tables : transliteration schemes
for non-roman scripts 発行:Library of Congress 1991)
...うへ(以下、延々「例」が続く)面倒くさくて挫折しましたが。LCのホームページを見るともっと詳しく載ってるかも。
---
Junko FOX
[china 6191] ピンイン分かち書き
> *****
確かに日本の図書目録法では(何種類かあるので絶対ではありませんが)、「日本語に対しては」分かち書きの規則があります。例えば、上の税所さんの文章を「図書目録用にわかちがき」すると:
ニッポン デ ガクジュツ ロンブン ノ ブンケン データベース
という風になります(システムにより「ニッポン」「ニホン」どちらかで統一したりしてヤヤこしい) が、「分かち書き」というのは、データベース作成上は、実は余り意味がありません。何故なら
1 索引を作るなら(分かち書きの有る無しに関わらず)頭からベタ読み
2 そうでないようなデータベースの場合、元々、図書目録法のような厳密な規則は存在せず、例えばインターネットの全文ロボット検索のような「抽出」検索になるので、分かち書きの意味はない
のです。
ただ、図書館業界というのは非常に特殊な世界なので(笑)ひょっとしたら中国にはあるかな? すいません、私、香港に来た時、まさにその業界に就職しようとしてたんですが、いかんせん中国語が出来ないもんで敢え無く惨敗、今に到るまでわかりません。でも想像するに、図書館業界のピンイン表記と言うのは、要はアルファベットと併せて並べるために存在するものであると思われるので、世界で一番通用している米国会図書館の規則に従っているのではないか?と思います。但しこの場合も「分かち書き」に関しての厳密な法則はありません:
ALA-LC Romanization Tables
Chinese
4. Word Division
Each character is romanized as a separate word.
Exceptions:
1) The romanized parts of multicharacter surnames and given
names are hyphenated.
2) The romanized parts of multicharacter geographic names are
hyphenated when these names appear in titles oras part of
corporate names (except for geographical generics, which
appear as separate words).
(参照:ALA-LC romanization tables : transliteration schemes
for non-roman scripts 発行:Library of Congress 1991)
...うへ(以下、延々「例」が続く)面倒くさくて挫折しましたが。LCのホームページを見るともっと詳しく載ってるかも。
---
Junko FOX