ゼロから学ぶ「フォントのしくみ」①:言語とスクリプトの関係/繁体字・簡体字・日本の漢字(かんじ)
—— フォントを正確に理解するためには『文字』『デザイン』『ソフトウェア』の3方向から理解する必要がある ——
これはフォントワークスで20年以上、フォントやソフトウェアの開発に関わってきたエキスパート、通称「ぬし」が新入社員の勉強会で最初に伝える言葉です。
フォントを開発・提供するメーカーである私たちは、デザインされた形をパッケージするだけでなく、文字の役割や機能を理解し、使いやすく美しい文字を届けるエンジニアリングの視点を持つことも重要になってきます。
そんなぬしのもとに、入社したばかりのケン(仮称)が配属されました。編集部メンバーも新入社員のケンさんと一緒に「フォントのしくみ」をゼロから教わって、皆さんにお届けしていこうと思います。
「文字」ってなんだろう?
言語とスクリプト(用字)の関係
ケン アプリやWebで見る日本語で、まれに漢字などが見慣れない形の文字で表示されることがあります。違和感は感じるけど、読めなくはないし……なぜそういったことが起こるんですか?
ぬし その疑問に答えるためには、フォントをエンジニアリングの側面から考えていく必要があります。いい機会ですから、ゼロから「フォントのしくみ」を一緒に学んでいきましょうか。
では、ケンさんに質問です。そもそも「文字」とは何ですか?
ケン 文字!? 文字は〜っ、言語を表記するための記号です。
ぬし では、少し意地悪な質問をします。漢字は何語ですか?
ケン 日本語です。でも、中国語でも使用しているなあ。
ぬし そう、共通した形の文字を使っている言語もありますね。例えばアラビア文字は、アラビア語だけでなくペルシャ語、エジプト語など多くの言語を表記するのに使用しています。下の表にいくつか例をまとめてみました。
ケン 「言語」とは別に「スクリプト(用字)」というのがありますね。
ぬし コンピュータで扱う文字の規格、ユニコード標準を定めているユニコードコンソーシアムでは、スクリプト(用字)という言葉を「1つまたは複数の表記体系でテキスト情報を表すために使用される文字およびその他の記号のコレクション。例えば、ロシア語はキリル文字のサブセットで書かれる。ウクライナ語は別のサブセットで書かれる。日本語の表記体系はいくつかのスクリプトを使用する」と定義しています。
ケン うっ。説明は難しいですけど、表を見たらなんとなく違いはイメージできました!
ぬし 文字は「言語を表記するための記号」には違いないけれど、「◯◯語を表す文字」という視点だけでは不十分です。フォントを提供する私たちは、文字を考えるときにスクリプトと言語の両方を頭に入れておかないといけません。
最近は特に多言語対応のニーズが増えてきていますが、「これは中国語フォントです」と言ってしまうと、簡体字なのか繁体字なのかが不明瞭になってしまいます。逆に、アラビア文字のフォントがあるのに、「エジプト語に対応できるフォントはありますか?」と聞かれて「ありません」とは答えたくはないものです。
同じ漢字でも形が違う
繁体字と漢字(かんじ)と簡体字
ケン さっきの表で、日本語のスクリプトには漢字(かんじ)が含まれていましたが、中国語に対応したスクリプトは、繁体字・簡体字となっていました。これは何ですか?
ぬし 中国を起源とする漢字は日本でも使われています。しかし、その漢字の形は中国のものと日本のもので全て同じというわけではありません。
日本と中国本土において、漢字は第二次世界対戦後にその形がそれぞれ大きく簡略化されました。したがって、台湾などで使用される繁体字(画数が多い伝統的な字体)、日本で使用される漢字(かんじ)、中国本土で使用される簡体字は同じ漢字の形が異なる場合があります
ケン あ! 最初に質問した「日本語なのに見慣れない形の漢字が表示される」のって、繁体字や簡体字で表示されていたんですね。これってフォントによって見た目が変わるんですか? それとも別々の文字なんでしょうか?
ぬし いい質問です。その答えにたどり着くためには、「字形・字体の違い」や「文字コード」など、まだまだ知ってほしいことがたくさんあります。一度に理解するのは大変ですから、少しずつ勉強していきましょう。楽しくなってきましたね!
ケン は、はい。(思ったより大変そうだけど……)興味は湧いてきました。よろしくお願いします!