close
html模版



立即點擊


標題

請問何謂:n-gram?


問題


請問何謂:n-gram?電腦網路相關用語~謝謝!更新:抱歉,好像其實是跟語言有關,網上找到的翻譯有N元詞、N連字串、N元語法....到底有沒有統一的中文用語呢?


最佳解答


一、 技術內容說明 (一)語音辨認技術 大字彙連續語音辨認技術(Large Vocabulary Continuous Speech Recognition)。 關鍵詞擷取技術(Keyword Spotting)。 (二)語音文件檢索技術 將已數位化的語音典藏資料進行語音辨認之後,建立基於音節、字、詞等多重(Multi-scale)重疊N連索引(Overlapping N-gram Indexing),進一步與文件檢索技術整合,讓語音典藏資料成為可以利用內含(content)查詢的資料。 (三)系統整合 實驗室目前已完成兩個影音新聞檢索雛形展示系統。 二、技術限制 語音典藏資料的錄音品質會大大影響語音辨認的正確率,受限於正確率不夠高,利用語音辨認技術將語音典藏資料轉譯文字目前仍不可行,但利用具容錯能力的文件檢索技術,仍可大致滿足檢索需求。 目前的技術僅能處理國語,其他方言的語音辨認技術及語言判定技術仍待開發。 三、可提供支援 提出支援要求單位請先提供錄音樣本,本實驗室需先進行語音辨認正確率評估,本實驗室人力非常有限,但會盡力配合。


其他答案


中文的文章是由一個個的句子組成,句子結束時都會加上標點符號,如分號,逗號,句號等,而句子本身是由許多字組成,若不考慮它的語意,而將相鄰的任意兩個字組合起來成為一個"詞",我們稱他為(Bigram),N個字所組成的稱為N元詞(N-gram),N-gram的方法是利用統計方式去計算詞在文章中數量,以求能在文章中斷出我們想要的詞,參考:http://www.csie.cyut.edu.tw/TAAI2002/TAAI2002PDF/Parallel%20Session(C)/C4%20Search%20and%20Information%20Retrieval/C4-7.pdf


以上文章來自奇摩知識家,如有侵犯請留言告知


https://tw.answers.yahoo.com/question/index?qid=20050919000013KK16212

00C5BB47411BB462
arrow
arrow

    g66fw93i 發表在 痞客邦 留言(0) 人氣()