當(dāng)前位置:
門鎖網(wǎng)>
門鎖新聞>
門鎖周邊>
詳情
手機(jī)版最新留言:
使用手機(jī)微信“掃一掃”功能,掃描以下二維碼,即可將本文分享到“朋友圈”中。
2024-06-23 編輯:中國(guó)門鎖網(wǎng) 來源:網(wǎng)絡(luò) 瀏覽數(shù):6636
是不是感覺和以往聽到的機(jī)器合成音有些不一樣,似乎是真人?不要懷疑,這仍然是AI生成,是由思必馳最新推出的超自然語音合成技術(shù)生成。作為國(guó)內(nèi)專業(yè)的對(duì)話式人工智能平臺(tái)...
是不是感覺和以往聽到的機(jī)器合成音有些不一樣,似乎是真人?
不要懷疑,這仍然是AI生成,是由思必馳最新推出的超自然語音合成技術(shù)生成。
作為國(guó)內(nèi)專業(yè)的對(duì)話式人工智能平臺(tái)型企業(yè),思必馳自主研發(fā)了全鏈路智能對(duì)話系統(tǒng),涵蓋聲學(xué)信號(hào)處理、語音識(shí)別與合成、性別/年齡/聲紋識(shí)別、自然語言理解、知識(shí)圖譜、對(duì)話管理、智能交互決策等技術(shù)鏈條。
思必馳在專注挖掘場(chǎng)景需求、不斷提升整體系統(tǒng)智能的同時(shí),也關(guān)注單點(diǎn)技術(shù)的持續(xù)創(chuàng)新與突破。比如在語音合成領(lǐng)域,思必馳近年來率先推出多項(xiàng)技術(shù),持續(xù)給客戶和終端用戶帶來更人性化、智能化的體驗(yàn)。
2022年,發(fā)布單人千音,實(shí)現(xiàn)單個(gè)音色就能生成同時(shí)覆蓋多種語言、多種風(fēng)格的語音合成聲音,極大豐富了合成語音的表現(xiàn)力;
2022年,推出發(fā)音人音色定制平臺(tái),支持客戶自主完成語音合成音色模型定制,降低語音合成定制門檻;
2022年,針對(duì)智能客服推出高情感、高擬人度的“多情感TTS”;
2022年,發(fā)布“千語千訓(xùn)”系統(tǒng),零人工介入、自動(dòng)更新模型,語音識(shí)別系統(tǒng)更新頻率實(shí)現(xiàn)了從周級(jí)到天級(jí)的跨越;
2023年,發(fā)布“聲音復(fù)刻”技術(shù),僅需錄制一句話即可復(fù)刻出自己的音色,支持任意文本的朗讀;
2023年,發(fā)布自然場(chǎng)景數(shù)字人生成技術(shù),個(gè)性化對(duì)話生成與語音合成模型無縫結(jié)合,構(gòu)建可自由交互的個(gè)性化IP;
2023年,發(fā)布支持基于生成擴(kuò)散模型的零樣本高質(zhì)量語音編輯,支持中文及英文,能夠像文本一樣去修改音頻......
而今天,思必馳又推出了一項(xiàng)全新的技術(shù):超自然語音合成,即基于語音特征離散化技術(shù)和大語言模型等,降低預(yù)測(cè)連續(xù)語音特征的難度,還原真人說話細(xì)微的韻律特點(diǎn)、發(fā)音口癖,讓合成效果更加自然、真實(shí)且富有表現(xiàn)力。該項(xiàng)技術(shù)適用于AI數(shù)字人、新聞播報(bào)、智能客服、智能助理等眾多應(yīng)用場(chǎng)景。

(在線體驗(yàn))
拿捏真人說話的“藝術(shù)”,高度還原細(xì)節(jié)
與傳統(tǒng)TTS生成聲音的刻板、不接地氣、缺乏真人聲音的抑揚(yáng)頓挫等相比,超自然語音合成的最大特點(diǎn)就是能夠高度還原真人說話時(shí)的細(xì)節(jié),特別是語氣詞、吸氣聲、停頓等。
當(dāng)我們和朋友聊天時(shí),語氣詞、吸氣聲、停頓以及字音拖長(zhǎng)等語言現(xiàn)象經(jīng)常出現(xiàn),這些語言現(xiàn)象并不是隨意的,而是自然而然產(chǎn)生的:
“啊”、“哦”、“嗯”等語氣詞能夠傳達(dá)說話人的情緒,吸氣聲表現(xiàn)了說話人在思考或準(zhǔn)備說話時(shí)的心理狀態(tài),猶豫時(shí)的停頓反映了說話人的不確定性,字音拖長(zhǎng)則強(qiáng)調(diào)了某個(gè)詞語的重要性......
當(dāng)細(xì)微的韻律特點(diǎn)和發(fā)音口癖被還原時(shí),你能感受到語音的生動(dòng)性和自然性,仿佛是在與真實(shí)的人進(jìn)行交流。
以銀行智能客服場(chǎng)景為例,用戶感受到的是與“真人”溝通的親切感和舒適度。

然而,要實(shí)現(xiàn)這樣完美的語音合成效果并不容易,需要先進(jìn)的語音處理技術(shù)和大量的真實(shí)語音數(shù)據(jù)來訓(xùn)練合成模型。與此同時(shí),還需要對(duì)語音學(xué)和語言學(xué)有深入的理解,以便能夠準(zhǔn)確地捕捉和復(fù)現(xiàn)語音中的細(xì)微差別。
關(guān)鍵技術(shù)創(chuàng)新突破,捕捉真人語音特點(diǎn)
為了還原真人說話效果,思必馳對(duì)韻律的多樣性進(jìn)行了深入研究,并將語音特征離散化應(yīng)用到語音合成領(lǐng)域。
語音特征離散化是指將連續(xù)的語音信號(hào)轉(zhuǎn)換為一系列離散值的過程。這種離散值通過使用自監(jiān)督(Self-Supervised Learning,SSL)模型提取得到,而自監(jiān)督模型則使用海量語音數(shù)據(jù)訓(xùn)練得到。在語音生成的過程中,用聲音模型將文本轉(zhuǎn)換成語音特征,離散化處理可以降低模型預(yù)測(cè)連續(xù)語音特征的難度,使其更容易捕捉到自然和多樣化語音的特點(diǎn)。
2022 年 4 月份,思必馳首席科學(xué)家、上海交通大學(xué)計(jì)算機(jī)系教授俞凱博士帶領(lǐng)的研究團(tuán)隊(duì)發(fā)表了將語音特征離散化技術(shù)應(yīng)用于文本到語音生成的關(guān)鍵成果,即《 VQTTS: High-Fidelity Text-to-Speech Synthesis with SelfSupervised VQ Acoustic Feature 》,這是業(yè)界首次將語音特征離散化應(yīng)用于從文本到語音生成的建模,使語音生成效果取得了突破性進(jìn)展。

在思必馳和上海交通大學(xué)計(jì)算機(jī)系跨媒體語言智能實(shí)驗(yàn)室的共同努力下,基于VQTTS 技術(shù)的思必馳情感音色悅悅?cè)〉昧烁哌_(dá) 4.7 的 MOS 分?jǐn)?shù),達(dá)到業(yè)內(nèi)一流水平。
思必馳也將VQTTS 技術(shù)應(yīng)用于超自然語音合成,結(jié)合大語言模型技術(shù)的成果,以及海量自然風(fēng)格的數(shù)據(jù),思必馳超自然語音合成技術(shù)可以更好地捕捉語言的韻律和語調(diào),從而生成更貼近人類發(fā)音的語音。
全新的語音交互體驗(yàn),賦能千行百業(yè)多場(chǎng)景
羅伊·澤扎納在《未來生活簡(jiǎn)史》一書中提到,三場(chǎng)科技革命將在未來改變?nèi)祟惖墓ぷ鳌⑸詈退季S方式。這三場(chǎng)革命分別是:個(gè)性化制造革命、智能革命和生物革命。在智能革命中,計(jì)算機(jī)開始模仿人類的部分語言和思維能力,人類也在此過程中得到提升。
思必馳DFM-2大模型已經(jīng)在智能家居、電商客服、在線教育、智能汽車等眾多場(chǎng)景落地應(yīng)用,基于語音大模型技術(shù)的超自然語音合成,將讓更多產(chǎn)品具有更好的人機(jī)交互體驗(yàn),讓更多用戶體驗(yàn)到了科技創(chuàng)新的成果:

在線上教學(xué)場(chǎng)景中,學(xué)生可以聽到自然、流暢且富有感情的授課內(nèi)容,激發(fā)學(xué)習(xí)熱情;在居家生活場(chǎng)景中,不僅能分享自己的喜怒哀樂,還能得到“真人”情感上的安慰和支持。
每一次科技進(jìn)步,都讓人類的生活更美好。基于超自然語音合成技術(shù),思必馳成將為千行百業(yè)的不同場(chǎng)景提供“真人”個(gè)性化聲音,助力開啟全新的語音交互之旅。
掃描下方二維碼,輸入文本即可獲得一段自然流暢、聲情并茂的“真人”音頻,快去動(dòng)手試試吧。
想了解這個(gè)項(xiàng)目,請(qǐng)聯(lián)系我!
我想加盟,請(qǐng)將項(xiàng)目的資料發(fā)給我。
請(qǐng)問我所在地區(qū)有加盟商了嗎?
想了解此項(xiàng)目的加盟流程,請(qǐng)聯(lián)系我!
請(qǐng)問加盟此項(xiàng)目需投資多少錢?
版權(quán)與免責(zé)聲明:
凡未注明稿件來源的內(nèi)容均為轉(zhuǎn)稿或由企業(yè)用戶注冊(cè)發(fā)布,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息的目的,如轉(zhuǎn)稿涉及版權(quán)問題,請(qǐng)作者聯(lián)系我們處理。我們對(duì)頁面中展示內(nèi)容的真實(shí)性、準(zhǔn)確性和合法性均不承擔(dān)任何法律責(zé)任。
如內(nèi)容信息對(duì)您產(chǎn)生影響,請(qǐng)及時(shí)聯(lián)系我們修改或刪除。
13520832007

今天已經(jīng)有 388 人獲取加盟資料
2025北京木門展,中國(guó)木門網(wǎng)采訪洛克曼智能鎖何總
2024門鎖網(wǎng)專訪凱理五金王總
2024門鎖網(wǎng)專訪三彪名派智能鎖黃總
隨著人工智能技術(shù)和物聯(lián)網(wǎng)技術(shù)的完善和普及,智能家居已經(jīng)進(jìn)入到千家萬戶,在消費(fèi)升級(jí)背景下,智能門鎖已然成為智能家居市場(chǎng)的一大風(fēng)口。
為了探尋飛利浦智能鎖的起步歷程和未來規(guī)劃,我們特地專訪了飛利浦銷售總監(jiān)劉志丹先生,希望能夠找到飛利浦成功的奧義所在,為行業(yè)的良性發(fā)展帶來一些啟示和靈感。
中居聯(lián)杯·2024年度門鎖及智能鎖十大品牌獲獎(jiǎng)名單
2024門業(yè)及定制家居品牌峰會(huì)暨中居聯(lián)杯·2023年度木門及門墻柜整裝十大品牌表彰盛典圓滿落幕
飛利浦智能鎖采用半導(dǎo)體指紋傳感器,識(shí)別靈敏度高,不僅能透過皮膚表皮層去采集更精細(xì)的指紋細(xì)節(jié),還具備指紋認(rèn)證修復(fù)功能。
隨著人們安全意識(shí)的不斷提高,家庭安防正在成為智能家居產(chǎn)品中日益崛起的一部分,其中涉及到的產(chǎn)品包括家用攝像機(jī)、智能門鎖、智能貓眼、智能門鈴、門磁傳感器、紅外報(bào)警器等等。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),家庭安防類設(shè)備在2...
CEEASIA亞洲三大專業(yè)消費(fèi)電子展之一、一年一度的消費(fèi)電子全產(chǎn)業(yè)鏈大會(huì) —— CEEASIA亞洲消費(fèi)電子展(北京)將于2022年6月25日-27日在中國(guó)北京亦創(chuàng)國(guó)際會(huì)展中心舉行。10月25日,中新展...
讓加盟更誠信 讓選擇更放心
立即咨詢做有權(quán)威的品牌