新聞網(wǎng)訊 近日,信息工程學(xué)院本科生曹康杰以第一作者在《Expert Systems With Applications》期刊上發(fā)表題目為“DMSeqNet-mBART: A state-of-the-art Adaptive-DropMessage enhanced mBART architecture for superior Chinese short news text summarization”的研究成果(論文鏈接:https://doi.org/10.1016/j.eswa.2024.125095)。論文通訊作者程衛(wèi)軍副教授給予了全程指導(dǎo),同時也受到了阿里巴巴Hummingbird Audio 實(shí)驗(yàn)室郝一亞博士后的指導(dǎo),論文合作者還包括本科生甘一超等4位同學(xué),并做出了相應(yīng)的貢獻(xiàn)。《Expert Systems With Applications》是人工智能、運(yùn)籌學(xué)等領(lǐng)域國際頂級期刊,在全球具有較強(qiáng)的學(xué)術(shù)影響力。

本研究針對中文互聯(lián)網(wǎng)短新聞文本數(shù)量與日俱增,如何快速、準(zhǔn)確地生成這些文本的精煉摘要所帶來的挑戰(zhàn),綜合應(yīng)用自適應(yīng)消息丟棄技術(shù)(Adaptive-DropMessage)、動態(tài)卷積層、門控殘差連接、自定義前饋網(wǎng)絡(luò)及增強(qiáng)的自注意力和交叉注意力機(jī)制等,首次提出了針對中文短新聞文本摘要的一種基于mBART框架的創(chuàng)新模型——DMSeqNet-mBART,如下圖所示。實(shí)驗(yàn)效果表明該模型顯著提升了摘要的流暢性、完整性和準(zhǔn)確性,并在多個權(quán)威數(shù)據(jù)集上超越了當(dāng)前的業(yè)界領(lǐng)先模型,如T5、MLC、PLCC和GPT-4。尤其在BERTScore、BLEU和ROUGE等關(guān)鍵指標(biāo)上,DMSeqNet-mBART的表現(xiàn)尤為突出。

該研究成果不僅為中文短新聞文本摘要提供了一個高效、精準(zhǔn)的解決方案,也為未來在其他語言和領(lǐng)域的文本摘要應(yīng)用奠定了堅實(shí)的基礎(chǔ)。DMSeqNet-mBART模型在新聞聚合、企業(yè)會議記錄總結(jié)、AI個人助手及教育工具等多個實(shí)際場景中具有廣泛的應(yīng)用前景。未來,本合作團(tuán)隊(duì)計劃繼續(xù)優(yōu)化該模型的架構(gòu),并探索其在多語言、多領(lǐng)域文本處理中的應(yīng)用潛力。
該研究成果得到了國家自然科學(xué)基金(52374169)的資助,充分體現(xiàn)了信息工程學(xué)院在科學(xué)研究和技術(shù)創(chuàng)新方面的實(shí)力和貢獻(xiàn)。