Monday, December 03, 2007

一年了,有所成長

工作了一年,我即將離開研發部門,轉而支援前瞻產品開發。回顧這一年,雖然我在語音合成研究部門,但事實上比較像是高級研發助理。

我所負責的工作是執行一個已成熟穩定的語言開發程序。語言開發包括了制定音素 (語音的最小單位)、找當地人錄音 (我最enjoy的部份,可以認識很多外國人並且用英文和她們溝通)、切音 (全神灌注處理語音資料的一種,通常是大家敬而遠之的工作)、語言正規化 (將語言的文法寫成程式)。

如上述所說,最花時間和眼力的是切音工作,顧名思義就是重覆聽著錄音並仔細看著聲波,為每一段聲波分類。而這一年我完成了10國語言,粗略地統計了一下,每個語言約有兩千個語音資料,而每個語音資料長度為兩秒,因此語音資料超過110小時!即使訓練有素的「專業切音員」也要花10秒才能處理完1秒的錄音,也因此,我共花了1100小時在處理這些聲音的片斷。我要瞎了!

No comments: