颱風天在家上網,偶然之下看到了 CMU 製作的一個音標資料庫:

The CMU Pronouncing Dictionary

雖然資料已經有點舊了,不過既然資料庫的版權說明寫著可以免費散佈使用,就想說把他拿來放進 cdict.net 裡面好了

網頁是使用 BIG5 編碼的,而顯示這些音標符號時,我又不想跟 YAHOO 字典 一樣,直接用小圖組成音標,所以就找了些資料,想辦法在 BIG5 的網頁下面利用 unicode 顯示這些音標符號

CMU 的資料庫中共用到 40 個音標符號,不過似乎並不是標準的 KK 音標,每個音標符號各以一或兩個英文字母的代碼表示,整份列表是長這個樣子的:

HARBESON  HH AA1 R B IH0 S AH0 N
HARBIN  HH AA1 R B IH0 N
HARBINGER  HH AA1 R B IH0 N JH ER0
HARBINGERS  HH AA1 R B IH0 NG ER0 Z
HARBINSON  HH AA1 R B IH0 N S AH0 N
HARBISON  HH AA1 R B IH0 S AH0 N
HARBOLD  HH AA1 R B OW2 L D
HARBOR  HH AA1 R B ER0

經過與 unicode 比對之後,整理出來的對應表如下:

代碼 音標 Unicode 顯示方式 代碼 音標 Unicode 顯示方式
AA ɑ U+0251 ɑ K k - k
AE æ U+00E6 æ L l - l
AH ʌ U+028C ʌ M m - m
AH0 ə U+0259 ə N n - n
AO ɔ U+0254 ɔ NG ŋ U+014B ŋ
AW ɑʊ U+0251
U+028A
ɑ
ʊ
OW o - o
AY ɑɪ U+0251
U+026A
ɑ
ɪ
OY ɔɪ U+0254
U+026A
ɔ
ɪ
B b - b P p - p
CH t U+0283 tʃ R r - r
D d - d S s - s
DH ð U+00F0 ð SH ʃ U+0283 ʃ
EH ɛ U+025B ɛ T t - t
ER ɚ U+025A ɚ TH θ U+03B8 θ
  ɝ U+025D ɝ        
EY e - e UH ʊ U+028A ʊ
F f - f UW u - u
G g - g V v - v
HH h - h W w - w
IH ɪ U+026A ɪ Y j - j
IY i - i Z z - z
JH d U+0292 dʒ ZH ʒ U+0292 ʒ

其中 ɝ 這個音標並沒有被 CMU 這個資料庫用到,我也不知為什麼,可能是它用的並不是標準的 KK 音標吧

另外,比較奇怪的一點是,使用 Firefox 瀏覽這些 unicode 音標符號都沒有問題,但是使用 Internet Explorer 的話,有部分符號會顯示出不出來(變成一個空白的框框)

經過試驗之後,把字型設定成 Lucida Sans Unicode 就可以了

CMU 這個音標資料庫中還有重音符號在內,只是由於它是標在母音的地方,所以如果沒有經過特殊判斷,直接顯示出來會跟一般字典上的音標表示法不太一樣

  音標 Unicode 顯示方式
重音 ˈ U+02C8 ˈ
次重音 ˌ U+02CC ˌ

這兩個重音符號,在 Firefox 下面一樣沒有問題,但是在 IE 下面,就算用 Lucida Sans Unicode 也是顯示不出來...XD 要用 Arial Unicode MS 才能顯示出來,但是 Arial Unicode MS 反而顯示不出上面的音標符號...

有興趣的人可以到 http://cdict.net/ 上面試用看看

8 Comments for this entry

歡迎留下您的意見