這章要介紹的是文字的基本概念以及一些被比較廣泛使用的文字。恰好之前也花了一段時間了解了一些不同的文字,所以就想說在這個系列加入這一章來介紹一些文字相關的知識。
另一方面,文字相關的研究領域相對於語言沒有那麼多元化,再加上我自己對文字領域的了解也不如語言領域,所以這一章的介紹比例會相對下降,而會加上一些自己的心得。
文字(writing system,或稱書寫系統)是為了方便書寫或記錄而用視覺化的符號來表達語言的一種系統。
由於文字只是一種表達語言的方式,文字和語言會形成多對多的關係。一種語言常會被幾種不同的文字表述(例如漢語可以用漢字、注音符號或羅馬拼音表述);一種文字也常被用來表述很多種語言(世界上有無數種用拉丁字母表達的語言)。
也因此,文字和語言是有需要在名稱上特別區分的,雖然在文字和語言比較接近一對一關係的場合有時會把兩者混用(例如緬文和緬甸語)。如果有注意看前幾篇的敘述的話,應該也會發現我是有刻意區分「文」和「語」的用法。
文字的學習並非像語言一樣可以自然而然地習得,需要經過教育才能學會(不過我不確定文字的學習會不會表現出至少一點「關鍵期」的現象)。也因此,在古代多數人都是不識字的文盲,只有接受教育的菁英階級才會使用文字。至近代由於教育的普及,識字率大幅提升,在近五十年來全世界的成人識字率從六成上升到接近九成,除了比較落後的國家以外,成人識字率幾乎都接近百分之百。
文字大概可以分為兩大類:表音文字(phonogram)和語素文字(logogram)。兩者的分法十分簡單:表音文字地符號本身不帶有語意,僅是用來表達語音;語素文字的符號則會用來表達語意。表音文字還可以再依照表音的方式來分類,這在之後的章節會一一說明。
雖說是「兩大類」,但是這兩類的數量是極度不平衡的。現在世界上幾乎所有的文字都是表音文字,現今還存留的語素文字大概只剩下漢字(當然還可以細分成正體、簡體以及日本漢字等等),以及一些使用者極度稀少的少數民族文字(其中有大部分分布在中國或其周遭,例如水書、方塊壯字、東巴文等等)。
接下來,就來介紹幾種世界上常用(有以國家為單位在使用)的文字吧!在介紹的過程中,也會順帶補充一些前兩章還沒有介紹完的東西。
先從這個最特別(也是這章唯一的非表音文字)、也是我們最熟悉的文字開始介紹起吧!之後的其他文字也會用類似的格式介紹,所以也算是熟悉一下這樣的格式。
因為漢字的是語素文字,符號的數量實在太多,這裡無法一一列舉,可以自己看字典(?
漢字的書寫方式是上到下、左到右。不過近代受到其他文字的影響,也逐漸採用了左到右、上到下書寫的形式(早期也會使用右到左的書寫形式,但並不是很普及)。另外,漢字的一大特色是其「方塊字」的形狀,
漢字的歷史應該是國文課的範疇,這裡應該不需要特別介紹(?
漢字作為幾乎唯一現存的語素文字,其在文字學中有其極大的特殊性。也因為歷史的因素,所以漢字也影響了很多東亞地區的文字表現。不過因為漢字實在是太複雜的關係,雖然早期有許多東亞地區語言都會使用漢字書寫,但後來就會自己發展出另外的簡易書寫方式(例如韓語,雖然仍然繼承了方塊字的形式)或者直接被棄用(例如越南語)。當代仍然廣泛使用漢字書寫的語言只剩下漢語各方言和日語(與假名混用)。
最後附個簡單的資料表。
種類:語素文字
書寫方向:上到下,或左到右
符號數量:至少 29921 個正字 + 74407 個異體字1
主要使用語言:漢語、日語
主要使用地區:東亞
使用人數:約 13.5 億人
演變史:甲骨文(、金文)、篆書、隸書
由於拉丁字母實在被太多語言所使用,表中僅列出每個字母比較常見用來表達的音素的 IPA。∅代表不發音,和 IPA 中長得很像的半閉圓唇前母音 [ø] 沒有任何關聯。
拉丁字母可以說是全世界最為普遍使用的文字,據估計全世界大約超過七成的人都在使用。由於歷史與文化的因素,如今幾乎每一種語言都會有至少一種用拉丁文字表達的模式。
拉丁字母由古義大利字母演變而來。下圖上排是古義大利字母的樣子,可以依稀看出拉丁大寫字母的樣子。
其又稱為羅馬字母,因為其起源於古羅馬文明。在西元一世紀時,拉丁字母主要為拉丁語所使用,只有 23 個字母,並且只有大寫字母,後來在十一、十七、十九世紀加入了 W、U、J,才發展為現在常見的 26 個。多數使用拉丁字母的語言都會使用全部 26 個字母,不過也有語言因為音素沒有那麼多所以沒有用到全部字母(例如世界語沒有 WXY),另外還有一些會額外增加一些符號(例如德語使用 ß)。更常見的是會在字母周圍加上一些附加符號(通常長得像斜線、點或曲線,例如 á、ö、ñ),以表達一些該語言特有的音素。
種類:全音素文字(下一節會解釋)
書寫方向:左到右
符號數量:26 個大寫、26 個小寫、不定量的增加符號或附加符號(因語言而異)
主要使用語言:多數羅曼語族、日耳曼語族的語言2,以及其它,族繁不及備載
主要使用地區:全世界
使用人數:約 50 億人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、希臘字母、古義大利字母
應該大家都知道全部的注音符號,雖然似乎如果突然要求一般臺灣人把注音符號背出來,有很高機率會需要回想一段時間才會想到(特別是韻母部分)(?
在進行簡介之前,我們要先介紹表音文字的其中兩類。
表音文字中,我們所比較熟悉的(例如拉丁字母)是「全音素文字」(alphabet),代表絕大多數的符號會對應到語言的一個特定音素。儘管有些會由幾個符號表達一個音素,或者有些符號代表的音素會隨環境改變,但幾乎不會有以一個符號表達兩個或多個音素的序列的情況。
值得注意的是 alphabet 這個英文的詞其實有幾種意義。其一是剛才提到的「全音素文字」;其二是指一種特定語言使用的表音文字中符號的集合(中文翻成「字母」或「字母表」,比較常用在全音素文字上,但也有例外,例如 Burmese alphabet「緬文字母」);其三也可以做為 writing system 的俗稱,雖然這個說法十分不嚴謹。3另一方面,中文的「字母」也可以指字母表或者字母表中的其中一個符號(letter),所以兩種語言上在講相關概念的時候都會需要根據前後文判斷是在指哪一個。
相對的,有另外一種文字叫做「音節文字」(syllabary),顧名思義就是多數符號是代表語言中的音節而非音素。例如日文中的假名多數符號都可以代表一個音節,或至少是音節的前子音和母音。
而注音符號特別的是它恰好介於兩種之間。ㄓ行和ㄙ行的符號都可以自成一個音節,而有許多韻母也是代表兩個音素的組合(雙母音或母音加鼻輔音4)。因此,這種文字就被稱為「半音節文字」(semi-syllabary)。
注音符號是刻意創造而非演變出來的,背景是清朝末年許多學者開始嘗試為漢語增加拼音系統。1912 年(民國元年)由中華民國的教育部通過採用注音字母,其後制定字母表,並於 1918 年正式公告發表。當初的注音符號和現在的注音符號已經高度相似,只是多了「ㄪ」、「ㄬ」、「ㄫ」並少了「ㄜ」,還有一些順序的不同,主要原因是因為當初設計是以漢語的另一個方言(老國音)為標準設計的。經過陸續的修正,到了 1932 年教育部決定改用以北京音為標準,注音符號就變成了今日的樣子。
如果仔細觀察的話,可以發現注音符號的安排有刻意照著語音特性安排,這是 1919 年調整的結果。例如聲母(子音)部分,ㄅㄆㄇㄈ的調音部位都包含嘴唇、ㄉㄊㄋㄌㄗㄘㄙ都是齒齦(後面三個都是有噝音)、ㄍㄎㄏ都是軟顎、ㄐㄑㄒ都是硬顎、ㄓㄔㄕㄖ都是捲舌;而每一列的第一個都是塞音或塞擦音、第二個都是第一個的送氣版本,第三、四則是鼻音、近音或擦音。韻母的部分比較沒有那麼整齊的規律,但是有按照單母音、雙母音、母音加子音的順序來排,並且雙母音和母音加子音的部分也是把同樣尾音的放在一起。
種類:半音節文字
書寫方向:左到右,或上到下(寫於漢字旁時)
符號數量:37 個 + 4-5 個聲調(+ 3 個已淘汰符號 + 4 個擴增符號)
主要使用語言:臺灣漢語
主要使用地區:臺灣
使用人數:約 2300 萬人5
演變史:由漢字挑選、簡化而成
這章接下來要介紹的文字都不是一般漢語或英語的使用者熟悉的(包括我在內),所以在內容當中也會比較詳細的介紹各種特性,希望至少能看完之後能認得出每一種文字(?)。
也因為自己從來沒有接觸過,所以之前有花了一點時間把這裡要介紹的每種文字的字母表都略略了學過一次(還有短暫背起來,雖然現在大部分都忘記了)。以下介紹的順序也是按照我自己當時學的順序,所以順序安排上不會特別有規律。這章的最後我或許會考慮放一些自己學這些字母的心得(?
和拉丁字母一樣,這裡列出的音素都是比較常用來表達的音素。注意到裡面有個 IPA 符號 [ɫ],代表的是軟顎化、咽化的 [l](亦即在發音的時候這兩個部位也略加收窄)。另外有個符號 [ɤ̞],下面那個像 T 的符號的意思是把該母音的開閉改為介於半開和半閉之間的位置(稱為「中母音」mid vowel),所以 [ɤ̞] 就是中後不圓唇母音。
另外,這張表取的是常用的西里爾字母,每種語言的所用的西里爾字母會不太一樣,順序也有可能有些微的出入,其中也沒有把一些常見加附加符號的字母(例如通常代表 /j/ 的 Й、通常代表 /j/、/o/ 或 /jo/ 的 Ё)列入。
西里爾字母和拉丁字母一樣,也普遍被大量不同的語言使用。不過和拉丁字母比較不同的是,西里爾字母在使用上不像拉丁字母大部分都固定會用到那 26 個,因此如果要回答「西里爾字母總共有幾個字母」這個問題會有一點困難。歷史上西里爾字母的數量其實比現在的多不少(有些資料說有 43 個),只是後來逐漸減少到現在的 30 個左右,恰好跟拉丁字母由少變多的改變方向相反。多數使用西里爾字母的語言會用到常見的大約 28 到 29 個字母(包含 Й),此外還會再加上一些 Ё、Ї、Ђ、Э、Є 之類的變形或帶附加符號的字母。如果用在非斯拉夫語族6的語言上,還會有一些自己新增的字母。
值得一提的是多數西里爾字母的大小寫長得幾乎一模一樣,但有些字母的斜體樣式有些和標準體樣式長得不太一樣或完全不一樣,例如以下幾個:
標準體 | 斜體 | 標準體 | 斜體 |
---|---|---|---|
Г г | Г г | Т т | Т т |
Д д | Д д | Ц ц | Ц ц |
И и | И и | Ш ш | Ш ш |
П п | П п | Щ щ | Щ щ |
西里爾字母和拉丁字母同樣都是從希臘字母衍生而來,所以可以觀察到兩者有一些共同或長得很像的字母。如果有在某些數學公式上看過一些希臘字母的話,應該也會發現西里爾字母有些跟希臘字母長得很像。
也因為西里爾字母和拉丁字母的共通點,所以要認出西里爾字母的難度比較沒有那麼大,甚至如果把跟拉丁字母不太一樣的幾個背起來的話,要把某種語言的西里爾字母全部背完並不會是很困難。當然,把字母表背完不意味著可以適當地唸出以西里爾字母表達的語言──正如把 A 到 Z 背完不代表可以適當地唸出英語一樣(雖然英語的拼寫規則是出名的特別不規則),還要知道該語言語音變化的相關規則。幾乎所有文字與語言對應的時候都會有這樣的現象,只是有些的變化明顯比較規則、有些比較不規則而已。
種類:全音素文字
書寫方向:左到右
符號數量:28~35 個大寫、28~35 個小寫、不定量的增加符號或附加符號(皆因語言而異)
主要使用語言:部分斯拉夫語族6語言,以及其它,族繁不及備載
主要使用地區:東歐、北亞、中亞
使用人數:約 2.5 億人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、希臘字母
因為希伯來字母大部分用在希伯來語上,所以這裡主要介紹的是希伯來語所用的希伯來字母。字母下方第一排是該字母的名稱在希伯來語的唸法,而最下排則一樣是它代表的音素。同樣的,∅也是代表不發音,和 IPA 中長得很像的半閉前圓唇母音 [ø] 沒有任何關聯。
希伯來字母在使用上會從右寫到左。不過,這張表上還是用左到右的順序列出 22 個字母。圖上有些字母有兩個符號以斜線隔開,代表該字母寫在字尾時寫法會不一樣,右邊的是正常的寫法、左邊的是字尾的寫法。
如果仔細看的話會發現這裡面列的音素沒有任何一個是母音,這是「輔音音素文字」的特色。因此,在進一步介紹希伯來字母之前,先得來介紹包含輔音音素文字在內的兩種常見表音文字種類。
所謂「輔音音素文字」(abjad),相對於「全音素文字」,意思就是在文字中只會表達輔音(子音)的音素,而不會表達母音的音素,每個子音搭配的母音就必須有該語言的知識才能知道。例如「注音文」寫起來就很像輔音音素文字(ㄐˋㄙnˋㄕˇㄌ˙ㄇˇ∅n ,∅ŋ ㄍ ㄏˊㄕˋㄎˇ∅ˇㄎnˋㄉ˙ㄔ ㄌˊㄓˋㄒ ㄓˋ∅n ㄈˊㄏˋㄗˋㄅˇㄉˊㄕnˊㄇ˙ㄅ˙?7),而要知道這些文字在表達什麼就必須對該語言(漢語)有所了解。實際上多數的輔音音素文字除了表達出輔音以外,通常還會有少部分的母音字母(通常是代表長母音),以避免歧義的產生。
輔音音素文字相較於其他表音文字的適用性就沒有那麼高,因為要能使用輔音音素文字的語言就需要有只從這些輔音就可以識別語意的特性,一些對母音依賴度比較高的語言要使用輔音音素文字就會十分困難。
至於元音副標文字(abugida),則是介於輔音音素文字和全音素文字之間的文字。這種文字的結構類似輔音音素文字,但是它會用一些附加符號來表達元音(母音),這些附加符號通常不被視為字母,正如「元音副標」之名,使得大部分的讀音都可以從文字中看出來。一般的輔音音素文字為了方便小孩或其它學習者學習,也會有自己的一套表達母音的附加符號系統,在兒童讀物上或給初學外國人閱讀的書刊上(最著名的是《古蘭經》)就會加上這些附加符號。加上這種附加符號的輔音音素文字,就也可以視作是一種元音副標文字。
現存世界上絕大多數的元音副標文字都是從婆羅米文字衍生出來、藉由印度文化傳播的婆羅米系文字,主要分布於南亞與東南亞地區,也就是現今所稱的印度文化圈或梵文文化圈。這點之後介紹到這些文字的時候還會再提到。
希伯來字母是一種輔音音素文字,也就是說其字母多數都是用來表達子音,母音在文字中幾乎都會被省略。有兩個字母(א、ה)可以以「不發音」的形態出現,但是輔音音素文字的「不發音」和一般我們對全音素文字的「不發音」有些不一樣:因為輔音音素文字的單一字母代表的是子音,當子音不發音的時後仍然可以帶有母音,所以這兩個字母如果不發音時有時會被看成是母音,儘管實際上母音一直都是被省略掉的。
就如一開始提到的,希伯來字母是從右邊寫到左邊,可以簡記為 RTL(right-to-left)文字。世界上目前比較普遍使用的 RTL 文字包含希伯來字母、阿拉伯字母和它拿字母。如果 RTL 文字和一般左到右(LTR)文字如果混用的時候就會造成一些排版上的麻煩,尤其是在電腦上顯示的時候。因此,電腦上文字編碼的標準 Unicode 就有制定當兩種文字同時出現的時候(這種情況稱為「雙向文字」bidirectional text,簡稱 BiDi)要怎麼顯示的標準演算法。
希伯來字母用以表達母音的附加符號系統稱為 niqqud。其實 niqqud 不只標記母音,還有重音、區分音素等不同功能,不過這裡只介紹母音的部分。以下是 niqqud 的母音表:
左邊十一個符號中虛線圓圈代表字母的位置,把子音填到圓圈的位置之後就會形成一個子音-母音的音節。如果在加了 niqqud 的情況有些子音沒有帶母音符號,就代表它沒有母音(可能是和下一個子音連在一起,或者是音節最後的子音)。可以發現有幾個不同的符號代表同樣的母音,這是因為希伯來語歷史演變的因素:古代的希伯來語有分長短音,所以不同的符號代表的是不同的長短,但當代的希伯來語已經沒有長短音之分,然而符號仍然繼續使用。右邊三個帶 niqqud 的字母可以獨自形成母音,而在沒有 niqqud 的情況下它們看起來就會跟一般的子音字母一樣,所以可以說這兩個字母也可以做為母音使用。
實際上希伯來語在發 /e/、/o/、/a/ 時會比較接近 [e̞]、[o̞]、[ä],不過這些不屬於音素的範圍,所以不會在這裡多提。
以下舉幾個希伯來文單字為例子,上面是帶 niqqud 的樣子,下面是一般的樣子。可以試著和上面的子音、母音表對著看,看能不能看得出來:
(如果仔細看的話會發現中間那個字 ב 裡面有個不在母音表裡面的點,那個點是為了區分 ב 代表的兩種音素 /b/ 和 /v/ 所用的。子音字母表中其他可以代表兩個音素的 ה、כ、פ、ש 也會用不同的點來區分要發哪一種音素。)
可以發現希伯來字母的順序有些其實和拉丁字母的差不多,這種順序最明顯的特徵就是代表 /l/、/m/、/n/ 的三個字母會照順序排在一起。不過我沒有查到這種字母順序到底最初的來源是什麼,抑或是這種順序到底是不是隨著文字或語言傳播的,還是只是文化的影響。
種類:輔音音素文字
書寫方向:右到左
符號數量:22 個,加上各種 niqqud 以及其他用來表達發音的附加符號
主要使用語言:希伯來語、意第緒語等
主要使用地區:以色列
使用人數:約 1400 萬人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、亞蘭字母
先來一張泰文字版的元素週期表(?
好啦,這純粹是隨便亂講的,只是把字母表排得很像週期表而已。真正的字母表在這裡:
由於泰文字同樣多數是用在泰語上,所以就一樣附上泰語的字母名稱,值得一提的是每一個字母名稱的後半段都是一個泰語的單字。以灰色標出的兩個字母是現在已經不再使用的字母,所以一般會說當代泰文字有 42 個字母。背景顏色跟聲調有關,這點後面會介紹。然而表中有幾個我們還沒有介紹過的 IPA 符號,所以接下來就先介紹它們。
IPA 標明聲調的方法有兩種系統:附加符號和獨立符號。附加符號用來表達比較概略的聲調,而獨立符號用來比較精準地表達聲調。
獨立聲調符號的表達方式比較直觀。這種標記法又稱為「趙氏聲調符號」,因為是由趙元任首先提出的。獨立聲調符號的表達法很簡單:把聲調的高低變化畫出來,然後在最右邊畫一條豎線就好了。例如漢語的一到四聲就可以分別標示為 ˥、˧˥、˨˩、˥˩。當跟其他符號寫在一起的時候,獨立聲調符號通常會標示在音節的最後,例如「例如」就會寫成 [li˥˩ɻu˧˥]。這個高低並不是隨便亂標的,一般會把聲調的高低分為五等分,然後看聲調大概是在哪個等分來做標示,例如上面舉例中二聲的符號就是從中間的等分上升到最高的等分、三聲的符號是從次低的等分下降到最低的等分。當然每個人對於等分的分法會有所不同,所以每個資料標示的符號都可能有些微的差異。
另外一種則是比較概略的附加聲調符號。用文字比較難敘述,所以先列出常見附加聲調符號和獨立聲調符號的一種可能對應:
附加聲調符號會加在音節的中心(通常是母音或濁子音)上,所以表中的虛線圓圈就是填上音節中心的符號。附加聲調符號只是表達出相對的聲調變化,所以沒有像獨立聲調符號那麼精準,通常是挑最好分辨的幾個來表達,例如漢語的一到四聲就有可能用 ◌́、◌̌、◌̀、◌̂ 來表示,儘管用 ◌̋、◌᷄、◌᷆、◌̂ 可能會更為精準。讀附加聲調符號的小技巧就是先把符號的最左邊的一節線段去掉,然後剩下的就大概是音調變化的形狀。
一開始泰文字母表中母音上方的附加符號就是 IPA 的聲調附加符號,可以發現表中總共出現了五種不同的符號(高◌́、中◌̄、低◌̀、上升◌̌、下降◌̂),這也是泰語中的五種聲調。用獨立符號的話,這五種聲調通常會標成 ˦˥、˧、˨˩、˩˩˦、˥˩。
雖然音節是我們所熟悉的,之前的篇章中偶爾也會提到,但這裡還是對音節相關的名詞與概念比較系統性地做個介紹。
音節在語言學上通常簡記為希臘字母 σ。一個音節的結構由下圖所示:
圖中每個符號的意義如下:ν 是音節核(nucleus),也就是音節的中心,是構成音節的必要元素,通常是母音或濁子音,有可能有多個(例如最常見的雙母音);ω 和 κ 分別是音節首(onset)和音節尾(coda),分別代表音節核前、後的子音們;τ 代表聲調(如果該語言有聲調特性的話);音節首又細分為首位 ι(initial)與中間位 μ(medial),其中首位代表音節首一開始不是響音(鼻音、近音、閃音或顫音)的子音們,中間位則是音節首除了首位以外的子音;音節核和音節尾合稱韻基 ρ(rime);整個音節扣掉首位合稱為尾位 φ(final),要特別注意尾位包含中間位。例如英語中的 glimpsed [ɡlɪmpst]8,音節核是 [ɪ]、音節首是 [gl](其中 [g] 是首位、[l] 是中間位)、音節尾是 [mpst]。另外,最下面的 C、H、V、T 分別代表子音、響音、母音和聲調,* 和 + 分別代表「零個或以上」與「一個或以上」9。
整個音節的結構中,只有音節核是必要的,音節首、音節尾都可以沒有任何東西。如果一個音節沒有音節尾,會稱這個音節為「開音節」(open/free syllable),反之有音節尾則稱為「閉音節」(closed syllable)。
所謂無聲除阻(no audible release)是一種塞音的特性,指的是不做出明顯除阻的動作,使得沒有除阻的聲音(如果忘記的話,「除阻」指的是發塞音的後半段氣流釋放噴出的過程),就好像發一個塞音但是只發到一半(只做出調音部位閉合的動作),例如如果發 [ap] 且把 [p] 無聲除阻的話,動作就是唸完 [a] 之後把嘴巴閉起來。如果有在國文課中讀過所謂的「入聲」,其實「入聲」指的就是有一個無聲除阻的尾音造成聲音變短的現象。無聲除阻在 IPA 中記為 [◌̚],其中的圈圈可以填入任何塞音。
無聲除阻常會在連續塞音中自然出現。例如英語中 doctor 如果唸快的話就不會刻意發出中間 [k] 的除阻音(因為後面緊接著 [t] 的除阻),只有把嘴型擺到「要準備發出 [k]」的位置,使其成為無聲除阻,IPA 標示為 [ˈdɒk̚təʴ]。
在泰文字母表中可以發現無聲除阻的子音都在音節尾,這並不是巧合,而是泰語的語音規則之一。位於音節尾的音素,如果是擦音、塞音或塞擦音,則會變成同部位的無聲除阻塞音;如果是近音、顫音或鼻音,則會變成同部位的鼻音。例如代表 /tɕʰ/ 的 ช 在音節尾會讀作 [t̚](這裡把 /tɕ/ 視為齒齦音);代表 /r/ 的 ร 在音節尾會讀作 [n]。這種音節尾無聲除阻的現象並不是泰語獨有,許多其它語言也都有這樣的規則。
泰文字是這個系列中要介紹的的第一個元音附標文字,也是婆羅米系文字之一。現在多數東南亞的文字,包含泰文字、緬文字、高棉文字與寮文字等,都是衍生自 6 世紀在印度南部出現的帕拉瓦文字,而帕拉瓦文字就是由南方的婆羅米文字(坦米爾-婆羅米文字)衍生出來的。
婆羅米系文字除了是輔音音素文字以外,還有一個很明顯的特點:其子音字母會分為主要由塞音、鼻音的構成,調音部位由後到前排序的五排(通常五排分別是軟顎、硬顎、捲舌或齒齦、齒齦或齒、唇齒或雙唇),最後還會有另外幾個擦音、顫音、近音。不過泰文字在婆羅米系文字裡面算是比較特別的,字母表比較沒有那麼整齊(?),下一節介紹高棉文字的時候會看到比較典型的婆羅米系文字字母表。
元音副標文字其實通常還有一個之前沒有介紹到的特性:如果子音字母單獨出現,那麼它通常會被視為帶一個固定的「固有元音」(inherent vowel),而非單獨的子音。泰文字的「固有元音」是 /a/(開音節) 或 /o/(閉音節)。
一開始那張字母表只有列出子音部分,因為就如先前介紹的,母音符號通常不會歸類為字母。以下列出泰文字十分複雜的母音附加符號表:
可以注意到泰文字中會用多個元音符號組合成代表一個元音音素的符號組合。表中如果有兩個圓圈,則左邊的代表的是音節首的字母、右邊的代表的是音節尾的字母,如果只有一個圓圈則是代表音節首的字母。音節首可以填入超過一個字母,形成有子音叢(consonant cluster,多個子音連在一起)的音節首10。不過也因為有子音叢的緣故,有些泰文字符號的序列會帶有歧義(例如說 ปลา 直接看可以看成 /pàlāː/ 或 /plāː/,但後者才是對的),一樣需要對語言的了解才能知道其實際上代表的音素。
另外,元音副標文字有時候會有一些可以單獨做為母音或音節、不需要跟子音字母組合在一起的符號或符號組合,稱為「獨立元音符號」。泰文字有以下四個獨立元音符號:
泰文字另一個特色是它是極少數在文字設計本身就有聲調標示的文字(注音符號也是,但畢竟注音符號並沒有作為任何語言的主要書寫方式),不過泰文字的聲調標示系統非常複雜。在字母表中可以看出子音字母分為三類,分別稱為低(藍色底)、中(綠色底)、高(紅色底)子音,然而這個低、中、高的名稱與聲調高低沒有直接關聯。這三類的子音會與母音長度、音節尾形式以及附加的聲調符號來共同決定該音節最後要發泰語五個聲調的哪一種,具體的表格如下:
表格中同一格由左到右(藍、綠、紅)代表的就是低、中、高子音,如果一個音節有多個子音的話,以音節首第一個子音為準。右邊兩個符號只能加在中子音上,所以只有一個符號。泰文字中也有幾個可以變化字母種類的機制。例如在近音、顫音或鼻音(都是「低子音」)前面加上 ห 這個字母會使其變成高子音(ห 本身不發音);在極少數的字中 อย 的組合視為一個中子音的 ย。
最後,一樣舉幾個泰文字的單字做為例子,也可以對照著上面的各種表看,試著把符號和音素對起來:
中間那個字最後一個字母上有一個附加符號,那是「不發音」的意思。
泰文字還有許多的規則與附加符號,但礙於篇幅這裡就不多加介紹了。
種類:元音副標文字
書寫方向:左到右
符號數量:42 個子音字母 + ~15 個母音符號 + 3 個獨立母音符號 + 4 個音調符號(+ 2 個已淘汰符號 + 其他附加符號)
主要使用語言:泰語、南部泰語
主要使用地區:泰國
使用人數:約 3800 萬人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、阿拉米字母、婆羅米文字、坦米爾-婆羅米文字、帕拉瓦文字、高棉文字
以灰色標出的兩個字母是現在已經不再使用的字母。這張表的背景顏色意涵與泰文字的不同,是與前面介紹的「固有元音」有關:黃色背景的固有元音是 /ɑː/、藍色背景的則是 /ɔː/。兩種不同的固有元音在和母音附加符號結合的時候也會產生不同的音素。值得一提的是硬顎塞音 /c/ 算是常見語言中相對少見的一種塞音,可能只比小舌塞音 /q/ 常見一點。
這張表裡面仍然有些還沒介紹過的 IPA 符號:/ɓ/、/ɗ/。這是先前有說之後在介紹的「非肺部氣流音」的其中一類:內爆音。
這裡就來介紹三大類非肺部氣流音中的兩類:內爆音(implosive consonant)與搭嘴音(click consonant)。這兩類子音有個共通點:在發這兩類子音的時候氣流都由外部進入嘴中,與一般的聲音相反。
在用文字介紹這兩類子音的發音機制前,可以先來「體驗」一下發出這兩種聲音的感覺。首先把嘴巴閉起來,並在嘴巴閉著的時候輕輕地作出一個用吸管把飲料大口吸到整個嘴巴裡(不是直接喝下去)的動作,有一點類似要準備吞口水的預備動作。有做對的話,兩頰應該會略為凹陷。接著把嘴巴輕輕打開,就可以發出類似「啵」一聲的聲音,這個聲音就是清雙唇內爆音 [ɓ̥]。(如果把嘴巴打開時不是發出「啵」聲,而是有氣流摩擦的聲音,可以試著一開始「吸」的力道小一點。)接著嘗試在嘴巴還閉著的時候就開始持續地發出 [m],並且重複剛才的動作,就會把它濁化成 [ɓ](整個過程可能會變成 [mɓa] 之類的)。[ɓ] 聽起來和 [b] 十分相似,但是正如第二章所介紹到的,這是因為我們的語言沒有這兩個音的對立。
相對地,如果在使用那枝想像中的「吸管」時不是吸到整個嘴巴,而只吸到嘴巴前面的話(有點類似親吻的動作,但嘴唇不會刻意施力),在嘴巴打開時發出的聲音就會有一些類似嘖嘖聲的氣流摩擦聲,所發出的就是清(不送氣)雙唇搭嘴音 [ʘ]。搭嘴音同樣也可以濁音化。可以聽聽看這兩者的錄音,看自己發出的聲音有沒有類似:濁雙唇內爆音(唸的是[ɓa aɓa])、不送氣雙唇搭嘴音(唸的是[aʘa])。
如果對上述兩種發音方式有點感覺之後,可以試著把調音部位改成齒、齒齦、硬顎三個位置(動作都差不多,只是一開始堵住氣流的部位不一樣而已),嘗試發出不同部位的內爆音和搭嘴音。內爆音甚至可以把調音部位改到軟顎或小舌;搭嘴音的變化就更多,例如可以鼻音化(發音同時從鼻子呼氣)、送氣甚至聲門化(之後會介紹),另外齒齦到硬顎間的搭嘴音則可以變成邊音。以下是 IPA 的內爆音和搭嘴音的符號表(wiki 版本):
BL、LD、D、A、PA、RF、P、V、U 分別是 bilabial、labialdental、dental、alveolar、postalveolar、retroflex、palatal、velar、uvular 的縮寫,而 tenuis 是「不送氣」的意思。(忘記這些名詞的話可以回第二篇看一下。)
論氣流機制的話,內爆音就是透過向下移動聲門(就是那個「吸管」的動作)使得嘴巴內部氣壓變小,使得調音部位打開後氣流短暫由外而內流入;而搭嘴音則是透過舌頭頂住軟顎附近、舌身略往後下方移動使得嘴巴前端的氣壓變小(這也是為什麼不會有軟顎以後調音部位的搭嘴音),並與內爆音一樣使得調音部位打開後氣流短暫由外而內流入。
最後回到高棉文的字母表。雖然在字母表中寫的是 /ɓ/、/ɗ/,然而在高棉語中並沒有 [ɓ] [b] 或 [ɗ] [d] 的對立(這點從字母表中也可以略略推測出來),所以有些人也會用 [b]、[d] 來發 /ɓ/、/ɗ/。事實上,雖然有不少語言都包含內爆音的發音,但有純粹內爆音對立(例如 /ɓ//b/,/ɓ//p/ 這種不算)的語言並不多11。
另一方面,使用搭嘴音的語言則是非常少數,幾乎都分布在南非一帶。然而這些使用搭嘴音的語言通常會使用很多種不同且互相對立的搭嘴音,其中甚至有多達四十種以上不同搭嘴音對立的語言。
高棉文字作為婆羅米系文字(同樣衍生自帕拉瓦文字),其字母排列是比較典型的婆羅米系文字排列方式。可以發現它字母的塞音、鼻音部分組成 5 × 5 的格式,列的部分和泰文字一樣是依據發音部位區分,而欄的部分第一、三欄是不送氣音、第二、四欄是送氣音,第五欄則是鼻音。之後在介紹其他婆羅米系文字的時候會發現它們的塞音、鼻音也會呈現這樣 5 × 5 的排列。
就如一開始所提到的,高棉文字的子音依據固有元音的不同分為兩類,固有元音是 /ɑː/ 的簡稱為 a 類、/ɔː/ 的則簡稱為 o 類。這兩類的區分是古代高棉語的清濁對立的遺跡(當代高棉語的清濁對立並不完全,因為同時還可以用內爆音與否區分)。從下列的(同樣很複雜的)母音符號表可以看出子音類別會連帶影響母音符號代表的音素。表中 [◌̆] 是 IPA 中代表「極短音」的符號。前兩排的虛線圓圈和最下面一排的 អ12 可以用任何子音字母取代。
另外可以發現高棉文字字母表中每個字母(除了 ឡ 外)都有正常的形態(左)和下標形態(右)。下標形態是高棉文字表達子音叢的方法:子音叢中第一個子音以正常形態表達,其後的子音則都以下標型態附加在第一個子音的符號之下。在子音叢中會以塞音或擦音為主來判斷整個子音叢要採用哪一類的發音方式,如果有多個同類音(多個塞音、擦音或多個響音)構成子音叢的話則以子音叢的最後一個子音為主。
高棉文字的另一個特色是有很多獨立母音符號,雖然用到它們的情況並不多。以下是高棉文字中的獨立母音符號表(灰色一樣代表現在已經不再使用):
高棉文字也有許多其他的附加符號(比泰文字還多),同樣礙於篇幅這裡不多介紹。最後同樣以幾個單字為例:
右邊那個字的下面兩個附加符號(/ɲ/ 的下標和 /om/ 的附加符號下面的部分)比較常會上下排列(/om/ 在下)而非左右排列,不過我用的這種字體會把它變成左右排列。
如果仔細對照高棉文字和泰文字的話會發現它們有些相似,因為泰文字是從高棉文字衍生出來的。最明顯的特徵是有許多長得幾乎一模一樣的母音符號,另外有幾個字母(比較明顯的例如 ច、ឆ、ក、ត、ភ 對應 จ、ฉ、ก、ถ、ภ)也有一定的相似度。
種類:元音副標文字
書寫方向:左到右
符號數量:33 個子音字母 + 31 個下標符號 + ~13 個母音符號 + 14 個獨立母音符號(+ 3 個已淘汰符號 + 其他附加符號)
主要使用語言:高棉語
主要使用地區:柬埔寨
使用人數:約 1150 萬人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、阿拉米字母、婆羅米文字、坦米爾-婆羅米文字、帕拉瓦文字
其中可以發現一些音素有上標 [ʕ](濁咽擦音的符號),這代表子音的「咽化」(pharyngealization13),也就是在發音的同時讓咽部略為縮緊。咽部縮緊的感覺可以透過發會厭顫音感覺到(會厭顫音的發音方式可以參考第三篇),而在發出子音的同時輕輕地做出發會厭顫音的動作理論上就可以發出咽化的子音。西亞、北非一帶的許多語言都有咽化的對立,柏柏爾語──也就是新提非納文字用來表達的主要文字──同樣也不例外。右下角的紫色符號是代表「唇-軟顎化」的附加符號(也就是在發子音的時候同時做出 /w/ 的嘴型),加在字母的右上方,在新提非納文字中通常只會用在代表軟顎塞音的字母(ⴳ、ⴽ)上。
新提非納文字是個蠻特別的文字。其前身是稱為提非納文字的輔音音素文字,其是右至左書寫,在大約二到三世紀的時期廣泛地用來表達圖阿雷格語(Tuareg)。然而在 1960 到 70 年代,摩洛哥開始有人提倡柏柏爾語(Berber)的教育,並且把原本的提非納文字加入母音變成全音素文字,並改為左至右書寫,就稱為新提非納文字。直到 2003 年,摩洛哥政府把新提非納文字正式列為柏柏爾語的書寫方式之一、2011 年把柏柏爾語列入摩洛哥的官方語言,新提非納文字就漸漸得到普及。因此,新提非納文字可以說是極少數非常近代才發展、出現並成功普及的文字。
新提非納文字的字母順序雖然很明顯地採用了拉丁字母的順序,不過其文字發展上與拉丁字母並沒有關聯,應該是創造新提非納文字的人為了方便普及、學習才將字母順序重新排列成拉丁字母的順序。
種類:全音素文字
書寫方向:左到右
符號數量:31 個 + 1 個附加符號 + 擴展提非納文字
主要使用語言:柏柏爾語
主要使用地區:摩洛哥
使用人數:約 100 萬人
演變史:撒哈拉岩刻、利比亞-柏柏爾文字、提非納文字
假名分為平假名(hiragana)和片假名(katakana)兩種,左半邊是平假名、右半邊是片假名。
有幾個字母的發音並沒有很符合規律,以紅字標出。不過對於紅字標出的聲音是否是不同的音素似乎有不同的看法,大部分資料表示它們的變化幾乎是可預測的,不過也有資料有提出近似最小對立體的例子。這裡為了表明發音的不同,所以還是把它用音素的符號標記。另外要注意第九行的子音是齒齦閃音 /ɾ/ 而非顫音 /r/14。
假名是一種音節文字,也就是其多數符號都表達獨立的音節。從假名的表格可以看出類似 5 × 10 的結構,也就是日語的五個母音音素和九個子音音素加上「沒有子音」所組成的所有子音-母音的開音節。這個表格就是稱為「五十音」的表格。(在假名系統完全成形之前,空缺的 /ji/、/je/、/wɯ/ 也都曾有對應的字母,只是因為用途不大、沒有廣泛使用而沒有被納入假名系統中。)
另外,假名中還有兩個常見的附加符號:把子音濁化或把 /h/ 變成 /b/ 的「濁音符」、和把 /h/ 變成 /p/ 的「半濁音符」(這個名稱從語音學角度看蠻有誤導性的)。把「ハ」加上濁音符、半濁音符後就會變成「バ」、「パ」。濁音符只會用在 /k/、/s/、/t/、/h/ 四行上,而半濁音符就只會用在 /h/ 行上。帶濁音符的字代表的音素在 /k/、/s/、/t/ 上是照原本的音直接濁化,例如 ち /tɕi/ 加上濁音符後就變 ぢ /dʑi/(不會變成 /di/)。
假名子音順序是有規律的。如果對上一篇還有一點印象的話,或許會覺得這個順序有一點點熟悉:/k/、/s/、/t//d/、/n/、/h//p//b/、/m/、/j/、/ɾ/、/w/。沒有想到的話,可以看一下下圖:
沒錯,假名的字母順序有受到婆羅米系文字的影響!實際原因是因為早期佛教文化傳入日本,而當時恰好是假名成型的期間,因此就從悉曇文字等婆羅米系文字引入了字母的概念。許多資料認為空海(774-835)這位日本僧侶(同時也是書法家)就是依據悉曇文字排列平假名的人。
假名和注音符號類似,都是由漢字擷取、簡化之後形成一套表音系統。不過假名的形成過程比較沒有像注音符號那麼人為,而是漸漸形成的。假名的前身是 5~6 世紀形成的萬葉假名,其是直接挑選一些和所要表達的音節發音相似的漢字來表達語音,也因此會有很多字表達同樣音的狀況,例如 /ka/ 對應的萬葉假名有「可」、「何」、「加」。到了 8~10 世紀,萬葉假名就逐漸統一、簡化而發展成假名,例如 /ka/ 就從對應的萬葉假名取「加」,並取其左半部形成「カ」。
種類:音節文字
書寫方向:上到下或左到右
符號數量:平假名 47 個 + 4 個小型字(拗音、促音);片假名 48 個 + 4 個小型字;2 個附加符號 + 4 個以上已淘汰符號
主要使用語言:日語
主要使用地區:日本
使用人數:約 1.2 億人
演變史:由漢字挑選(萬葉假名)、簡化而成
天城文也是一種典型的婆羅米系文字,所以同樣我們可以看到同樣結構的 5 × 5 塞音、鼻音排列,不過其和之前介紹的泰文字、高棉文字等帕拉瓦文字一系列的文字在發展上關係比較遠。天城文另一個明顯的外觀特徵是每個字母上面的橫槓會連在一起(舉例:देवनागरी)。我沒有查到這個橫槓在天城文中的名稱,不過類似的橫槓在孟加拉文也有出現,而其在孟加拉語叫做 matra。
同樣的在此附上天城文的母音表。天城文的母音表明顯比泰文字和高棉文字的簡單很多。同一格中左邊的是獨立元音、右邊的是母音附加符號,兩者發音相同:
天城文用來表達子音叢的方法又與之前介紹的泰文和高棉文不同。其中一種是加上代表「沒有母音」的附加符號(長得像字母下面的一撇),例如「क्」、「ख्」、「ह्」;但更常見的方法是把兩個子音字母「融合」、連寫在一起,例如以下幾個例子:
大部分子音叢的連寫法都是有特定規則的變化,多數些是單純拿掉第一個字母的豎槓並寫在一起、另外還有一些是某個字母會變特定的形狀(例如綠色那兩個),不過有少數幾個額外的符號(例如紅色那兩個)被用來表達特定幾個子音叢。
天城文大約在一到四世紀成形,到七世紀就開始被廣泛使用。目前天城文已經成為被使用得最廣泛的婆羅米系文字(也是全世界第四多人使用的文字,前三名分別是拉丁字母、漢字和阿拉伯字母),印度次大陸一帶超過 120 種語言15都會使用天城文。
最後值得一提的是「天城」文是少數中文翻譯使用意譯而非音譯的文字名稱(देवनागरी Devanagari 直譯是「神聖的城」),不知道是不是因為「德瓦那加里」太多字了(?
種類:元音副標文字
書寫方向:左到右
符號數量:34 個子音字母 + ~17 個母音附加符號 + ~14 個獨立元音符號 + 許多子音叢符號 + 其他附加符號(因語言而不同)
主要使用語言:部份印度-雅利安語支的語言(包含印地語、馬拉提語、博杰普爾語、邁蒂利語、信德語等等)與其它,族繁不及備載
主要使用地區:印度次大陸,特別是北印度地區
使用人數:約 6 億人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、阿拉米字母、婆羅米文字、笈多文、城文
字母下面是字母名稱和在希臘語經常代表的音素。
希臘文字大概在公元前八世紀就已經成形,是最早出現的全音素文字。希臘字母也可以說是當今絕大部分全音素文字的始祖,無論是直接、間接自希臘字母衍生而成(例如「長得有點像拉丁字母」的拉丁字母、西里爾字母、亞美尼亞字母),或者是輔音音素文字或元音附標文字受到希臘字母或其衍生文字影響而變成全音素文字(例如新提非納文字)。
字母名稱的部分需要特別說明。由於希臘字母被廣泛地使用在數學或各類科學的研究上,因此這些領域的人們會經常需要稱呼這些字母。然而這種用途的希臘字母卻發展出了另外一套字母名稱,而且不同地區還會有發音差異(如果好好的照 IPA 唸上述的字母名稱時會覺得很奇怪的就應該是學了這套的字母名稱,例如把 π 發成 [paɪ] 而非 [pi])。具體原因是希臘語的發音從古自今有不少變化,而當今英文對希臘字母的發音大致上是使用比較接近古希臘語的發音16。事實上,希臘語發音的變化也有透過一些文字方面的遺跡保存下來。例如今日用來表達 /f/ 的 φ,在古代的希臘語是代表 /pʰ/,而這個字母的名稱用拉丁字母表達出來的話寫成 "phi" 就是這個原因。
種類:全音素文字
書寫方向:左到右
符號數量:24 個大寫 + 24 個小寫
主要使用語言:希臘語
主要使用地區:東地中海地區(希臘、賽普勒斯)
使用人數:約 1100 萬人
演變史:埃及聖書文、原始西奈字母、腓尼基字母
又是一種婆羅米系文字,這種字母格式應該已經熟悉到不能再熟悉了吧!先來看看它的母音表。同樣地同一格中左邊的是獨立元音、右邊的是母音附加符號(灰色是現在已不再使用的符號):
雖然孟加拉文和天城文在發展關係上並不相近,但是這兩種文字還是保留了許多相同的特徵,如果把兩張字母表對在一起就會發現有不少特徵相近的字母。孟加拉文的輔音叢表達法也和天城文一樣,都是通常是把字母連寫、或者在字母底下加上一撇:
孟加拉文的連寫規則比天城文複雜,有許多字母在連寫時會以簡化形式出現(例如圖中藍色的例子),不過孟加拉文會使用連寫的子音叢數量比天城文少。
另外應該也可以發現孟加拉文的母音附加符號的形狀和泰文字、高棉文字都還是很像(例如 /i/、/e/、/o/),可以說婆羅米系文字幾乎都有共通的母音附加符號特徵。
種類:元音副標文字
書寫方向:左到右
符號數量:33 個子音字母 + ~10 個母音附加符號 + ~11 個獨立元音符號 + 許多子音叢符號 + 其他附加符號(+ 6 個已淘汰符號)
主要使用語言:孟加拉語
主要使用地區:孟加拉
使用人數:約 2.6 億人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、阿拉米字母、婆羅米文字、悉曇文字、孟加拉-阿薩姆文字
IPA 符號下面的兩條線代表緊音(tense voice),而對應的一般聲音則會被稱為鬆音(tenseless / lax voice)。鬆緊對立原本是用來描述母音的性質,代表發母音的時候肌肉比平常用力,通常是位置上的更趨向極端(母音圖的外側)、嘴巴收小。然而在這裡鬆緊對立用來描述的是子音,據研究顯示,韓語(也就是諺文主要表達的語言)的鬆緊對立具體的發音方式是發緊子音的時聲門略為收緊(但沒有完全閉上到形成擠喉音)、喉部放低。
諺文應該所有表音文字裡面最特別的一種,因為它幾乎是完全人造的:沒有直接演變自任何既有的文字,而是在西元 1443 年時朝鮮世宗依照語音學的特徵發明的。也因為其依照語音學發明的背景,諺文被認為是一種「特徵文字」(featural script),代表其文字形狀會直接表明語音學上的特徵。IPA 有一部分也算是一種特徵文字,因為其有些語音學特性可以直接從形狀上看出來(例如字母下方下右彎的曲線代表「捲舌」、字母上方往上右彎的曲線代表「內爆音」)。
至於諺文的形狀有哪些語音學規則呢?先從比較明顯的母音,解釋其字母構造的思路。首先,先有六個基本母音:「ㅣ」/i/、「ㅏ」/a/、「ㅓ」/ʌ/、「ㅗ」/o/、「ㅜ」/u/、「ㅡ」/ɯ/(字母形狀取自古中國的陰陽二元觀)。接著,非「ㅣ」/i/ 的基本母音都可以加上「ㅣ」形成複合母音,這在古韓語原本是代表雙母音,但是現代的韓語只留下「ㅢ」/ɰi/ 的近音-母音組合有類似雙母音的特徵,其它四個都取了雙母音的中間點變成單母音,從母音圖上可以明顯看出:
接著「ㅏ」、「ㅓ」兩個字母以及其加上「ㅣ」的變化可以分別加上「ㅗ」、「ㅜ」表達前置 /w/,然後所有帶有短槓的字母都可以把短槓重複表達前置 /j/。如此就是諺文中的所有母音字母了!
至於子音的部分,則是透過發該調音部位所產生的姿勢來產生。例如軟顎音 /k/ 取舌根頂到軟顎時舌頭側面的形狀而寫成「ㄱ」;齒齦音 /n/ 取舌尖上翹頂到齒齦脊的側面形狀寫成「ㄴ」;/s/ 的「ㅅ」左半邊是牙齒、右半邊是舌頭(也是側面的輪廓);雙唇音 /m/ 取嘴巴的正面形狀「ㅁ」;代表沒有子音的「ㅇ」是聲門的輪廓。接著 /tɕ/「ㅈ」、/t/「ㄷ」以及現在已不使用的 /ʔ/「ㆆ」是「ㅅ」、「ㄴ」、「ㅇ」加上上面一橫代表塞音。最後凸出或額外的線條代表送氣,例如「ㅋ」、「ㅊ」、「ㅌ」、「ㅍ」、「ㅎ」就是「ㄱ」、「ㅈ」、「ㄷ」、「ㅁ」、「ㆆ」的送氣版本;把符號重複一次代表緊音。比較特別的是 /ɾ/「ㄹ」是「ㄷ」上面加上類似「ㄱ」、代表閃音的符號;以及 /p/「ㅂ」凸出的線條是代表塞音而非送氣。
諺文的書寫方式受到漢字影響,所以字母排列方式是把一個音節的所有音素寫在一個方格中,先寫首位的子音字母、再把中間位加上音節核(由一個母音字母代表)寫在子音字母的右或下方,最後如果有音節尾的話再將其子音字母寫在最下面。例如 /su/ 寫成「수」、/kʰim/ 寫成「킴」(硬顎音的字母遇到只寫在右邊的母音會彎曲)等等。有些字會有音節尾由兩個子音的子音叢組成(總共有 11 種組合),就會把兩個子音字母左右並排寫在一起。下圖是諺文音節的所有可能排列方式:
韓語也有類似泰語的音節尾無聲除阻規則,所以例如代表 /tɕ/ 的「ㅈ」、/tɕʰ/ 的「ㅊ」、/s/ 的 「ㅅ」、/t/ 的「ㄷ」,在音節尾都會無聲除阻而發成 [t̚]。比較特別的是代表沒有子音的「ㅇ」在音節尾代表另一個音素 /ŋ/,而代表 /h/ 的「ㅎ」在音節尾發 [t̚]、代表 /ɾ/ 的「ㄹ」在音節尾發 [ɭ](或者有些人會發 [l])。另外韓語也有連音的規則,也就是兩個音節連在一起的時候,有些第一個音節的音節尾和第二個音節的首位的組合會有一些發音的改變,不過這些改變幾乎都是語音層面的(phonetic),音素通常不會因連音而改變。
如果要將諺文歸類為音節文字、全音素文字、元音副標文字或輔音音素文字之一的話,幾乎所有研究者都會將其視為字母排列規則比較特別一點的全音素文字。一開始看會覺得諺文的母音符號寫在子音符號旁邊,似乎符合元音副標文字的特性,但是元音副標文字有個重要的條件,就是「固有元音」:輔音字母必須要可以不帶任何母音而單獨存在形成音節,而諺文並不能這樣使用。和吉茲文字一樣,如果把所有音節的可能組合列出來的話,其也可以視為(有幾千個字母的)音節文字,而 Unicode 的確也是這麼做的,它把所有可能的 11172 個符號(其中超過一半是幾乎不會在韓語中出現的符號)都放進符號表中。
種類:全音素文字,特徵文字
書寫方向:左到右或上到下
符號數量:40 個字母 + 11 個組合音節尾子音字母(由 24 或更少個基本符號組成)
主要使用語言:韓語17
主要使用地區:朝鮮半島、中國吉林省
使用人數:約 7900 萬人18
演變史:自創文字,筆畫、書寫方式受漢字影響
首先要特別介紹的是「吉茲」的拉丁字母轉寫(Geʽez)中的「ʽ」這個符號(左右相反的引號)。一般來說如果在拉丁字母轉寫看到這個符號,代表的通常是濁會厭擦音 /ʕ/,這裡也不例外:Geʽez 的讀法是 [ˈɡɨʕɨz]。
另外如果是一般的引號「’」,代表的則通常是聲門塞音 /ʔ/,這兩者長得很像,所以看到的時候要特別注意。例如「夏威夷」的轉寫是 Hawai’i,就是唸成 [həˈvɐjʔi],[ɐj] 和 [i] 中間有聲門塞音 [ʔ],所以不能連在一起。
如果不知道聲門塞音要怎麼發的話,可以試著非常非常短促地(愈短愈好)唸出 [i],這樣為了讓發音足夠短,就會很自然地在 [i] 前後加上聲門塞音變成 [ʔiʔ]。
吉茲文字屬於元音副標文字,這裡列出的是子音字母。同樣地,這裡列出的只是常用的符號,並非所有語言都會用到這些符號,也有些語言會使用額外的符號。
可以看到其中有些音素的 IPA 中有個單引號。這是這個系列要介紹的最後一種聲音:擠喉音。
擠喉音是我們要介紹的第三類、也是最後一類的非肺部氣流音(在第七篇介紹高棉文字的 3-8 已經介紹過搭嘴音和內爆音了)。擠喉音的 IPA 符號就是在一般的塞音、擦音或塞擦音符號後面加上一個單引號,例如 [k']、[s'] 等。
要發出擠喉音其實很簡單:在閉氣的情況下想辦法發出正常的塞音、擦音或塞擦音,就會變成擠喉音。可以先嘗試發一般的 [s] 音;接著,嘗試在閉氣的情況下再發出這個音(如果沒辦法想像什麼叫作在閉氣時發出 [s] 的感覺的話,可以先把氣吐光,然後在吸下一口氣之前連續發很多次 [s]),並且同時摸頸部,如果有感覺到喉部在發 [s] 的同時向上移動就是成功發出 [s'] 了。由於閉氣的情況下氣流不能從肺部流出,所以為了產生發出 [s] 所需要的氣流,聲門會向上移動從咽部擠出氣流,這也是「擠喉音」之名的由來。
因此,擠喉音的發聲原理就是用聲門向上移動擠出氣流以發出塞音、擦音或塞擦音,恰好和內爆音(聲門向下移動)相反。如果知道如何發出內爆音的話,可以嘗試連續交替發出內爆音和擠喉音(例如 [s'ɓ̥s'ɓ̥s'ɓ̥] 之類的),就可以明顯感受到聲門的上下移動(?
其實理論上鼻音或顫音也有其相對的擠喉音,但是其在語言中幾乎沒有出現,目前還沒有發現任何有擠喉音對立的鼻音或顫音的語言。
吉茲文字屬於元音副標文字,但是並非婆羅米系文字。吉茲文字在發展歷史上也與世界上其它常見文字的關聯較小(新提非納文字也是如此),所以吉茲文字的形狀和特性也會和其他文字有蠻大的不同。
雖然說吉茲文字屬於輔音音素文字,但是其實它的元音「副標」並不是附加符號,而是有點像天城文子音叢連寫的那種方式把元音符號「融合」到字母的形狀當中,而有些連寫的方式也沒有那麼規則。以下舉六個子音字母加上不同母音之後的樣子為例:
可以發現吉茲文字的固有元音是 /ə/。同一個母音都會有一些共同的特徵,但是也會有一些例外,這導致光看字母原本的形狀和母音符號的特徵很難預測組合之後的符號會長什麼樣子。也因此,如果把每個子音加母音的組合符號視為單一符號的話,那麼吉茲文字也可以被看作是一種音節文字。在 Unicode 中,吉茲文字就被視為音節文字處理,也就是其是把子音加母音的組合視為單一的符號,而不是像之前介紹的幾種婆羅米系文字是把子音和母音的符號分開。
種類:元音副標文字或音節文字
書寫方向:左到右
符號數量:26 個以上的子音字母(因語言而異) + 母音附加符號(半不規則變化,總計可組合約 200 餘個符號) + 其他擴展符號
主要使用語言:部份閃語族的語言(包含阿姆哈拉語、吉茲語、提格利尼亞語等等)與其它,族繁不及備載
主要使用地區:衣索比亞、厄利垂亞
使用人數:約 1800 萬人
演變史:埃及聖書文、原始西奈字母、古南阿拉伯字母
這裡列出的只是常用的一些阿拉伯字母以及其常用來表達的音素,並非每種語言都會用到這裡所有的符號,也有些語言會用到沒有列在這張表中的符號。
阿拉伯字母也是右寫到左的文字,但是這裡列出字母的順序是從左到右。這裡列出字母的順序也是依照多數語言的字母排列順序,但每種語言的字母順序可能會有些許差異,甚至同一種語言也有可能有幾種常見的字母排列方式。
阿拉伯字母是一種輔音音素文字。然而在字母表中卻可以看到其中有少數幾個字母可以用來表達母音,這是因為為了避免歧義,使用阿拉伯字母的語言會把部分母音表達在文字當中(通常是長母音,但這與語言高度相關,不同語言需要表達的母音會有不少差異)。
阿拉伯字母一個外觀上明顯的特色是其在書寫的時候會連寫在一起,變成從右到左一長條的形狀(例如 تصنيفها)。這是因為阿拉伯字母每個字母都有其寫在字首、字中和字尾的形式,以下舉幾個代表性的字母為例(基本上其它沒有列出來的字母就是換一下點的位置、數量而已):
注意到有些字母的字中、字尾形式相同,這種字母如果出現在字中,則其下一個字母就要採用字首(或單獨,如果後面沒字母了)形式。例如如果 ج 和19 ا 和 م 和 ع 寫在一起就會變成 جامع。
阿拉伯字母中用來表達母音和其它發音的附加符號系統稱為 tashkil(類似希伯來字母中的 niqqud)。以下列出 tashkil 中比較重要的符號:
其中最後一個符號是用來標示長子音(有些語言有長子音和短子音的對立)。
最後來舉幾個阿拉伯語的單字為例,也可以嘗試對著上面的表看看:
種類:輔音音素文字
書寫方向:右到左
符號數量:28 個以上的子音字母(因語言而異) + 用來表達發音的附加符號
主要使用語言:部分閃語族語言(包含阿拉伯語、波斯語、烏爾都語、旁遮普語等)與其它,族繁不及備載
主要使用地區:西亞與北非
使用人數:約 6.6 億人
演變史:埃及聖書文、原始西奈字母、腓尼基字母、亞蘭字母、敘利亞字母
正如第六篇最開頭所提到的,之前有把這章介紹的所有文字的符號都嘗試背過一次,所以這節就來記錄一下這個過程以及一些感想(?)。也因此這節就是純心得而已,沒什麼介紹的部分。
其實想要嘗試背世界上的各種文字字母的想法甚至始於我修語言學概論之前。當初只是覺得這樣可以知道很多文字的結構,感覺還蠻好玩的(?),所以就覺得可以試試。不過畢竟這是一件完全沒有實用價值的學習計畫20,所以就略略估計了一下這樣會不會浪費太多時間,結論是如果試著以每天大概背三、四個字母(背字母的定義是知道怎麼寫、在一種語言上的字母名稱和它常用來代表什麼音素)的速度執行、而且不要求長期記憶的話(也就是背完忘掉就算了),每天花費的時間應該可以壓在通勤時間當中,而且大概一年就可以走過十幾種文字。覺得這樣的速度還算可行,因此就用「被用來做為某種做為一個國家主要官方語言的主要表達文字」的條件篩選出了 23 種文字,扣除漢語和拉丁字母剩下 21 種,就隨便排了順序開始進行這個計畫。
於是之後就展開了一段在學校和家裡搭捷運往返時就打開手機、點開維基百科開始背字母的生活。這個計畫也有一些些意外的收穫:因為我都是用維基百科來理解文字的結構或背誦,所以在理解的過程中會順便吸收到一些語言學的知識。後來在修語言學概論的時候剛好兩者有一點點相輔相成的作用,尤其是在查字母代表的音素時就會順便學到各種調音部位、對立等等的知識,所以在語概學語音學時就變得十分輕鬆。
接著就依照自己背誦的順序,針對每種文字寫一下自己對於各種文字特性的感受。
背誦時間:2019/04/15 - 2019/04/28
背誦/理解難易度:★✰✰✰✰
易忘程度:★★✰✰✰
自己把西里爾字母排在最前面,因為想說它跟拉丁文字比較像,背起來應該比較輕鬆。事實確實如此,基本上蠻快就能把大小寫字母的對應都記起來。雖然過了一年多,絕大部分的字母現在看到都還是大概知道它代表的音素,只是字母順序忘得差不多了。
背誦時間:2019/04/29 - 2019/05/14
背誦/理解難易度:★★✰✰✰
易忘程度:★✰✰✰✰
由於之前就有略略接觸過希伯來字母,加上其字母數量比較少的關係,所以基本上到現在都還背得出 22 個字母的名稱和順序,重要的 niqqud 也都還記得。
自己覺得希伯來字母的印刷體長得還算蠻美觀的,只不過自己要寫的時候常常抓不到要字母的比例(?
背誦時間:2019/05/17 - 2019/06/01, 2019/10/14 - 2019/10/28
背誦/理解難易度:★★★★✰
易忘程度:★★★✰✰
自己隨便挑了一個元音副標文字放在第三個,想說可以先理解一下輔音音素文字在做什麼。結果由於是第一次接觸到這種形狀扭來扭去的字母(?),加上字母數量也很多,還有不知道要怎麼背母音附加符號的關係,一直沒辦法順利背起來。後來就因為覺得背不太起來加上期末的忙碌就暫停了,一停就是四個月。直到隔學期決定重拾這個計畫,由於之前已經有一些印象了,再背起來就比較沒有那麼困難。
然後自己覺得泰語用單字做為字母名稱很有趣,感覺就像把 A for apple、B for ball 這種東西變成字母名稱一樣(?
背誦時間:2019/10/29 - 2019/11/17
背誦/理解難易度:★★★✰✰
易忘程度:★★★★★
原本把泰文字和高棉文字排一起是想說這兩個是衍生關係,應該有一點輔助作用,沒想到這兩種文字差超級多,一個是扭來扭去一個是折來折去(X),再加上母音附加符號又要記兩種音素(a 類和 o 類),所以還是很難記。不過至少熟悉了元音副標文字之後確實在理解上就不會那麼困難了。然後高棉文字的獨立元音符號真的超容易忘記,應該背好後一兩天就忘得差不多了(?
另外值得一提的是因為看到內爆音的音素,所以就想說順便學學內爆音怎麼發。但是看 wiki 的文字介紹(氣流機制)完全沒有辦法想像或實際操作,後來看了一些網路上的問答才自己抓到方法。內文介紹提到想像吸管的方法是我學會之後自己想到、覺得最貼切的描述。
背誦時間:2019/11/18 - 2019/11/25
背誦/理解難易度:★★★✰✰
易忘程度:★★★★✰
背新提非納文字的那段時間剛好比較有空,所以八天就背完了。一方面也是因為每個字母都是簡單的幾何形狀所以很好記,但是也因為這樣沒有什麼特色,所以也就很容易忘掉。然後不得不說新提非納文字的形狀十分有趣,看起來很像外星人用的文字(X
我把理解難易度打得比較高的原因是因為當時看到咽化音完全不知道那是什麼東西或怎麼發,後來學了更多語音學、抓到會厭作為調音部位的一些子音的發音方式之後才大概有點感覺。
背誦時間:2019/11/26 - 2019/12/18
背誦/理解難易度:★★★✰✰
易忘程度:★★★✰✰
假名的字母數量真的很多,所以很難記也很容易某一行整個忘記。不過由於自己小學的時候好像有看過五十音介紹(忘記為什麼了),有些字母有點印象,所以背起來沒有想像中困難。
背誦時間:2019/12/19 - 2020/01/02
背誦/理解難易度:★★✰✰✰
易忘程度:★★★★✰
由於在高棉文字的時候大概熟悉了婆羅米系的字母排列,所以理解天城文就相對簡單不少。不過不知道為什麼,天城文對我來說也很難長期記住。
值得一提的是因為一開始設定的目標本來就是只記字母,所以連寫的規則就沒有記,所以就算背好字母還是有時候會遇到看不懂的符號。
另外,我覺得天城文是還沒學和學完之後看起來差最多的文字之一(另外一個是阿拉伯文字),因為文字會全部連在一起的特性,還沒學的時候視覺上就會覺得一坨東西在那邊不知道在幹嘛(?
背誦時間:2020/01/03 - 2020/01/10
背誦/理解難易度:★✰✰✰✰
易忘程度:★★★✰✰
由於在科學、數學等領域上常會使用到希臘字母,所以很好背。而易忘程度打得比較高的原因,一方面是字母名稱很容易忘掉(用科學上的那套讀音用得太習慣了),一方面是偶爾還是會忘記字母的順序。
希臘字母也是另外一種印刷體會讓我覺得有點好看的文字。
背誦時間:2020/01/29 - 2020/02/17
背誦/理解難易度:★★✰✰✰
易忘程度:★★★★✰
各方面都跟天城文差不多,這裡不再多提。不過孟加拉文和希伯來字母類似,都是手寫很難寫得好看的文字(?
背誦時間:2020/02/26 - 2020/03/09
背誦/理解難易度:★✰✰✰✰
易忘程度:★✰✰✰✰
諺文真的很容易學。尤其是在學過語音學的情況下,掌握住造字原則,要忘記也不是那麼容易。比較容易忘記的大概是音節尾變化,不過因為之前有接觸過泰文字所以也不構成什麼問題。(不過我沒有記連音規則就是了。)
然後關於諺文的簡單程度,據說韓國有一句關於諺文的俗語是這麼說的:「聰明的人自己一個人用一個早上就可以學會;再笨的人都可以在十天內學會。」我自己用了十幾天的零碎通勤時間學會,不知道有沒有合格(?
背誦時間:2020/03/10 - 2020/03/28
背誦/理解難易度:★★★★★
易忘程度:★★★★★
又是一種長得很像外星文字的文字(X)。其實遇到吉茲文字讓我必須重新定義什麼叫做「背完所有字母」,因為要記完所有的母音符號不規則變化實在是太耗時間了,所以最後決定只記下各個母音最常見的變化。
然後吉茲文字從各方面都很難記。光字母順序就根本不知道是怎麼排的(?),然後字母名稱也很奇怪,更別提它也是那種扭來扭去細節很多的文字。
因為有擠喉音音素,所以也順便學了怎麼發擠喉音,結果發現比想像中簡單很多。
背誦時間:2020/04/22 - 2020/04/30
背誦/理解難易度:★★★✰✰
易忘程度:★★★✰✰
由於之前去伊朗在學波斯語字母的時候就有接觸到阿拉伯字母(波斯語也是用阿拉伯字母表示),所以嚴格來講就比較算是複習。只不過有些字母在波斯語表達的音素會不太一樣,所以有一部份需要重記。
順帶一提,阿拉伯字母寫成的書法蠻漂亮的,不過沒有學過阿拉伯語和書法的話,就算對阿拉伯字母很熟也不太可能看得懂。
《教育部異體字字典》之數量,另有 2002 個正異體關係不明的字。 ↩
常見的包含義大利語、法語、西班牙語、葡萄牙語、荷蘭語、英語、德語等等。 ↩
另外還可以指某家公司(? ↩
講「鼻子音」怪怪的(? ↩
以臺灣五歲以上人口估計。沒有找到合適的參考資料(? ↩
常見的斯拉夫語族語言包含俄語、烏克蘭語、波蘭語、捷克語、克羅埃西亞語等。斯拉夫語族多數都是主要使用拉丁字母或西里爾字母兩者之一表示。 ↩ ↩2
就算少了母音,應該還是可以看得出來這些注音符號在表達什麼吧? ↩
這是英語中少數以四個連續子音結尾的單字之一。 ↩
如果學過 regular expression 就一定會知道的東西(? ↩
泰語的音節尾不會出現子音叢。 ↩
比較多人使用、有內爆音對立的幾個語言:豪薩語、信德語。 ↩
用 អ 的原因只是因為打字如果用虛線圓圈的話電腦會沒辦法正常顯示附加符號的位置。 ↩
第一眼看會覺得這個單字有很多不同字母,雖然實際上只有 13 個(? ↩
[ɾ] 是最常見的發音,但是不同地區或族群的方言也有不同的發音,例如 [dɹ]、[l]、[ɺ] 等等。 ↩
印度次大陸一帶通行(有很多人使用)的文字和語言種類都非常多,不過我沒有查到造成這個現象的歷史因素。 ↩
另外還有較少人使用的濟州語、吉阿吉阿語,甚至是臺灣閩南語。 ↩
北韓沒有識字率統計,所以這個數據沒有包含北韓。 ↩
這裡用「和」而非頓號連接,因為如果用標點符號的話 Unicode 的雙向文字規定(參見第六篇希伯來字母的介紹)會把整段視為右到左而讓字母順序跑掉。 ↩
或許如果哪一天需要學相關語言會有極微量的實用價值,不過曾經會過字母跟完全不會對於學習語言而言好像根本完全沒差(? ↩
《A 到 Z 計畫》
第三章:常見文字介紹