阿里云宣布基于通義大模型的音視頻內(nèi)容AI新品“通義聽悟”正式上線,成為國(guó)內(nèi)首個(gè)開放公測(cè)的大模型應(yīng)用產(chǎn)品。據(jù)介紹,通義聽悟接入了通義千問(wèn)大模型的理解與摘要能力,可幫助用戶隨時(shí)隨地高效完成對(duì)音視頻內(nèi)容的轉(zhuǎn)寫、檢索、摘要和整理,比如用大模型自動(dòng)做筆記、整理訪談、提取PPT等。公測(cè)期間,用戶可領(lǐng)取100小時(shí)以上免費(fèi)轉(zhuǎn)寫時(shí)長(zhǎng)。
“換一種方式,讓音視頻可以被輕松閱讀、整理和分享。”阿里云CTO周靖人介紹,聽悟是一款工作學(xué)習(xí)AI助手,它瞄準(zhǔn)具有高知識(shí)附加值的音視頻內(nèi)容場(chǎng)景,比如開會(huì)、上課、訪談、培訓(xùn)、面試、直播、看視頻、聽播客等,能通過(guò)大模型等最新AI技術(shù)快速提煉和沉淀知識(shí)。
據(jù)周靖人介紹,聽悟融合了十多項(xiàng)AI功能,可以全面提升知識(shí)從音視頻向圖文形態(tài)轉(zhuǎn)化的效率。除了“聽力好”,能高準(zhǔn)確度生成會(huì)議記錄、區(qū)分不同發(fā)言人外,還可以一秒給音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn)、整理關(guān)注重點(diǎn)和待辦事項(xiàng)。未來(lái),一鍵提取PPT、針對(duì)多個(gè)音視頻內(nèi)容向AI提問(wèn)、概括特定段落等功能也將上線。
據(jù)了解,聽悟除個(gè)人版本外,還有企業(yè)應(yīng)用。此前,聽悟企業(yè)版已在阿里集團(tuán)內(nèi)部被廣泛使用。