近日,聲網(wǎng)與RTE開(kāi)發(fā)者社區(qū)聯(lián)合主辦的 Convo AI & RTE 2025 第十一屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在北京舉行,本屆大會(huì)以“AI 有聲”為主題,重點(diǎn)聚焦實(shí)時(shí)互動(dòng)(RTE)與對(duì)話式 AI (Convo AI)深度融合的新場(chǎng)景、新架構(gòu)與新機(jī)遇。
資料顯示,RTE(Real-Time Engagement)指實(shí)時(shí)互動(dòng)技術(shù),正廣泛應(yīng)用于直播、電競(jìng)、遠(yuǎn)程辦公、在線教育、IoT、元宇宙。實(shí)時(shí)互動(dòng)指在遠(yuǎn)程條件下溝通、協(xié)作的多方能夠隨時(shí)隨地接入、實(shí)時(shí)傳遞、虛實(shí)融合的多維信息,并體驗(yàn)身臨其境的交互活動(dòng)。
在今年的RTE 2025實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)開(kāi)場(chǎng)演講中,聲網(wǎng)創(chuàng)始人兼CEO趙斌表示,聲網(wǎng)年度服務(wù)分鐘數(shù)首次突破1萬(wàn)億分鐘,標(biāo)志著RTE技術(shù)已成為不可或缺的關(guān)鍵基礎(chǔ)設(shè)施。與此同時(shí),視頻高清化比例在過(guò)去兩年增長(zhǎng)超過(guò)10倍,海外市場(chǎng)720p以上分辨率流量占比已超80%,WebRTC全球搜索熱度呈現(xiàn)爆發(fā)式增長(zhǎng),標(biāo)志著實(shí)時(shí)互動(dòng)行業(yè)正迎來(lái)新一輪創(chuàng)新熱潮。
然而,在基礎(chǔ)設(shè)施日趨完善的同時(shí),產(chǎn)業(yè)依然面臨著從“連通”到“對(duì)話”的本質(zhì)挑戰(zhàn)。當(dāng)交互對(duì)象從“人與人”擴(kuò)展到“人與AI”,實(shí)時(shí)互動(dòng)在環(huán)境感知與交互自然度上仍存在明顯缺陷。行業(yè)數(shù)據(jù)顯示,僅21%的用戶對(duì)現(xiàn)有AI對(duì)話體驗(yàn)滿意,部分服務(wù)的用戶流失率高到“不可接受”。要實(shí)現(xiàn)真正的“類(lèi)人對(duì)話”,企業(yè)必須系統(tǒng)性攻克低延遲響應(yīng)、自然打斷、上下文管理、情感理解與表達(dá)等復(fù)雜挑戰(zhàn)。
多模態(tài)大語(yǔ)言模型(LLM)的出現(xiàn)讓計(jì)算機(jī)具備了類(lèi)人的實(shí)時(shí)語(yǔ)音對(duì)話能力,為解決這些挑戰(zhàn)帶來(lái)了全新路徑。趙斌表示,對(duì)話式AI正驅(qū)動(dòng)RTE從能夠“正常對(duì)話”到 “聲情并茂”的關(guān)鍵躍遷,為RTE行業(yè)帶來(lái)一個(gè)不可估量的全新市場(chǎng)。
第三方機(jī)構(gòu)Deepgram和Opus Research調(diào)研顯示,67%的企業(yè)已將語(yǔ)音AI智能體置于戰(zhàn)略核心位置,84%的企業(yè)計(jì)劃在未來(lái)一年增加相關(guān)投入。在開(kāi)發(fā)者生態(tài)中,對(duì)話式AI與語(yǔ)音智能體創(chuàng)業(yè)公司呈現(xiàn)爆發(fā)式增長(zhǎng)態(tài)勢(shì)。數(shù)據(jù)顯示,聲網(wǎng)對(duì)話式AI 相關(guān)用量在2025年第三季度實(shí)現(xiàn)151%的環(huán)比增長(zhǎng)。
在眾多應(yīng)用場(chǎng)景中,對(duì)話式AI將在情感陪伴、智能硬件、在線教育三大場(chǎng)景中率先實(shí)現(xiàn)規(guī)模化落地。在大會(huì)現(xiàn)場(chǎng),趙斌演示了AI客服的功能,展現(xiàn)了當(dāng)前對(duì)話式AI在實(shí)時(shí)交互與場(chǎng)景理解方面取得的突破性進(jìn)展。
此前在2025世界人工智能大會(huì)(waic)上,聲網(wǎng)正式發(fā)布新版對(duì)話式AI引擎,該版本新增聲紋識(shí)別、數(shù)字人與視覺(jué)理解三項(xiàng)功能,實(shí)現(xiàn)對(duì)話式AI音視頻交互體驗(yàn)的全新升級(jí)。
為幫助企業(yè)和開(kāi)發(fā)者把握這一機(jī)遇,聲網(wǎng)在大會(huì)上正式發(fā)布了《2025對(duì)話式AI發(fā)展白皮書(shū)》及《對(duì)話式AI好奇者手冊(cè)》,為行業(yè)提供了一套系統(tǒng)的實(shí)踐指南。同時(shí),聲網(wǎng)推出了對(duì)話式AI引擎2.0,對(duì)話式AI開(kāi)發(fā)套件、對(duì)話式AI模型評(píng)測(cè)平臺(tái)和對(duì)話式AI Studio,加速對(duì)話式AI在實(shí)時(shí)互動(dòng)行業(yè)的應(yīng)用創(chuàng)新。