国产做爰又粗又大的视频,青青热久精品国产亚洲AV无码,夜夜高潮次次欢爽AV女视频,成人无码区免费A片视频韩国,日韩A片无码毛片免费看小说

中文
搜索

新宇智慧&tcworld China 2025:大語言模型在本地化行業(yè)的應(yīng)用

發(fā)布時(shí)間: 2025年05月30日瀏覽量:

5月22日至23日,tcworld China 2025技術(shù)傳播大會(huì)隆重舉行。在此次盛會(huì)上,新宇智慧副總經(jīng)理劉海明先生帶來了題為《大語言模型在本地化行業(yè)的應(yīng)用》的精彩分享,引發(fā)了與會(huì)者的廣泛關(guān)注與深入思考。



大語言模型(LLM)憑借其卓越的語言理解和生成能力,在翻譯、內(nèi)容生成、術(shù)語管理、語義QA等多個(gè)領(lǐng)域展現(xiàn)出無限潛力,變革的征程已經(jīng)開啟。

盡管AI翻譯的價(jià)值不言而喻,但在質(zhì)量方面仍存在挑戰(zhàn)。翻譯服務(wù)需求方擔(dān)心的問題包括“難以準(zhǔn)確傳達(dá)深層次語義”“對(duì)特定領(lǐng)域表達(dá)準(zhǔn)確性不足”以及“翻譯質(zhì)量難評(píng)估”。



為了更好地挖掘和應(yīng)用大模型的能力,新宇智慧積極開展了一系列應(yīng)用實(shí)踐。在不斷嘗試各種方法的過程中,我們發(fā)現(xiàn)RAG(檢索增強(qiáng)生成)是一種可以很好地與知識(shí)積累相結(jié)合的解決方案。RAG通過問題向量檢索,從企業(yè)知識(shí)庫匹配相關(guān)知識(shí),將這些知識(shí)進(jìn)行整合,再調(diào)用大模型,根據(jù)提示詞生成高質(zhì)量的回答。將RAG技術(shù)融入AI翻譯流程,可明顯提升所生成譯文的質(zhì)量。

在翻譯和本地化行業(yè),翻譯記憶庫、術(shù)語庫是天然的RAG數(shù)據(jù)。除此之外,風(fēng)格指南、帶有描述和分析的例句集,指令性文件也會(huì)發(fā)揮很大作用。



通過一個(gè)具體的例子,我們能看得更清楚。


原文

Every section of this hotel tells its own story, with a beautiful skylight to illuminate unique features and elements within.

DeepSeek

酒店的每處空間皆訴說獨(dú)特故事,華美天窗映襯其間別具一格的特色與設(shè)計(jì)元素。

ChatGPT

酒店的每個(gè)區(qū)域都在講述自己的故事,華美的天窗傾灑光芒,照亮其獨(dú)具匠心的特色和元素。

建議

透過美麗的天窗,陽光照亮一處處獨(dú)具匠心的設(shè)計(jì)與精心搭配的元素,轉(zhuǎn)角精品酒店的每一處細(xì)節(jié),仿佛都在講述一個(gè)精彩的故事。


我們知道,理解一句話含義的關(guān)鍵在于抓住語義重心。語義重心是語言交際最重要的部分,通常落在結(jié)果、結(jié)論或事實(shí)上。不言而喻,在這句話中,英文原文的語義重心是hotel tells its own story。在翻譯實(shí)踐中,英漢句子組織存在差異,英語句首封閉,句尾開放,后置修飾功能強(qiáng),漢語句首開放,句尾封閉,前置修飾功能強(qiáng)。英語邏輯順序多為歸納演繹,即按果因、結(jié)論陳述展開,而漢語邏輯順序往往按時(shí)間的從先到后、空間的從大到小、從一般到具體、從因到果。在語義重心上,英語一般采用前重心位,漢語一般采用后重心位。顯而易見,AI翻譯確實(shí)把字面的含義翻譯出來了,但是在句子組織、信息傳遞、情感傳遞方面,AI翻譯并不足夠。


如果我們能夠把AI沒有意識(shí)到的上述問題總結(jié)出來,并且以RAG形式告訴AI,那么離解決這樣的問題一定是更近了一步。針對(duì)英漢差異,新宇智慧在實(shí)際項(xiàng)目過程中不斷積累典型例句,并對(duì)例句做了分析整理與分類,形成了內(nèi)部培訓(xùn)教程和知識(shí)庫。



上面的例句與英漢語義重心相關(guān),除此之外,新宇智慧還總結(jié)了漢語無主句、英譯漢代詞省略、英譯漢連詞省略、英漢詞匯語義差異、歐式中文、中式英語、主謂結(jié)構(gòu)與話評(píng)結(jié)構(gòu)等很多英漢差異相關(guān)的知識(shí)主題。

英漢差異僅僅是本地化適配中的一個(gè)部分。LISA(Localization Industry Standards Association)曾指出四大類本地化適配的關(guān)鍵問題,包括語言問題,如不同語言間的差異,格數(shù)性、固定搭配等;物理硬件問題,如不同的插頭標(biāo)準(zhǔn);商業(yè)與文化問題,如本地貨幣支持及稅務(wù)合規(guī);技術(shù)問題,如阿拉伯和希伯來語鏡像。

在LISA這四類問題的基礎(chǔ)上,新宇智慧按思維方式、實(shí)體、地域特征、社會(huì)價(jià)值觀、社會(huì)風(fēng)俗習(xí)慣、宗教和歷史原因、法律因素、民族因素八大類細(xì)分六十三個(gè)小類來總結(jié)文化適配問題。比如在法律因素這個(gè)大類中,包含出邊境線、國(guó)家/地區(qū)名稱、地圖、旗幟、法規(guī)(如禁用詞、游戲分級(jí)、新廣告法)五個(gè)小類。所以這些被清晰識(shí)別的問題,都可以很好地應(yīng)用于RAG。



技術(shù)的發(fā)展從來都不是一蹴而就的,它遵循著從無到有、從有到優(yōu)的漸進(jìn)規(guī)律。盡管存在諸多問題,但在當(dāng)前階段,AI在本地化行業(yè)已經(jīng)展現(xiàn)出了實(shí)實(shí)在在的應(yīng)用意義。



展望未來,隨著技術(shù)的不斷進(jìn)步和創(chuàng)新,大語言模型在本地化行業(yè)的應(yīng)用前景將更加廣闊。新宇智慧也將繼續(xù)深耕這一領(lǐng)域,不斷探索和實(shí)踐,為推動(dòng)本地化行業(yè)的智能化發(fā)展貢獻(xiàn)更多的智慧和力量。
相關(guān)新聞