English
當前您的位置: 當前位置: bat365首頁 > bat365動态 > 正文

我院蔣智威老師課題組在文本質量評估領域再獲新進展

發布日期:2023-07-25 浏覽量:

我院蔣智威老師課題組在文本質量評估領域取得新進展,其成果分别被自然語言處理頂級國際會議The 61st Annual Meeting of the Association for Computational Linguistics(ACL2023, CCF-A類會議)以及信息檢索領域頂級國際會議 The 46th International ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR2023, CCF-A類會議)長文錄用。

三篇發表論文分别為:

1. Improving Domain Generalization for Prompt-Aware Essay Scoring via Disentangled Representation Learning。該研究旨在改進自動作文評分(AES)模型的泛化能力,使其在未見過的作文提示上表現更好。為此,提出了一種提示敏感的神經AES模型,用于提取作文評分的全面表示,包括提示不變和提示特定的特征。同時,設計并引入了解耦表示學習框架,通過基于模角對齊的對比學習策略和基于反事實數據的自訓練策略來解耦表示中的提示不變信息和提示特定信息。在ASAP和TOEFL11數據集上進行的大量實驗結果表明了該方法在領域泛化設置下的有效性。該論文發表在ACL2023會議上,歡迎對該研究感興趣的同行來信交流:jzw@nju.edu.cn。

2. Aggregating Multiple Heuristic Signals as Supervision for Unsupervised Automated Essay Scoring。該研究貢獻了一種名為ULRA的新型無監督式自動作文評分(AES)方法。ULRA的核心思想是使用多個啟發式質量信号作為僞真實标簽,然後通過學習這些信号的聚合來訓練神經AES模型。為了将這些不一緻的質量信号聚合為統一的監督,ULRA将AES任務視為排序問題,并使用特殊的Deep Pairwise Rank Aggregation(DPRA)損失進行訓練。在DPRA損失中,每個信号都有一個可學習的置信權重來解決沖突,并通過成對訓練方式來解開部分排序對之間的級聯效應。在ASAP數據集上的實驗結果表明,ULRA在無監督方法中表現優異,與許多領域自适應的監督模型相比也具有可比性,充分展示了其有效性。該論文發表在ACL2023會議上,歡迎對該研究感興趣的同行來信交流:jzw@nju.edu.cn。

3. Unsupervised Readability Assessment via Learning from Weak Readability Signals。該研究提出了一種新穎的無監督可讀性評估框架(LWRS),旨在評估文本的閱讀難度,而無需使用手動标記的數據進行模型訓練。該框架通過一組啟發式信号來描述文本的不同可讀性方面,從而指導模型輸出可讀性分數進行排序。相比于依賴标記數據的方法,LWRS 的多信号學習模型能夠有效利用多個啟發式信号進行模型訓練,并采用成對排序範式來降低偏序對之間的級聯耦合。此外,研究還提出了一種基于信号共識分布的策略,用于确定最具代表性的可讀性信号。實驗結果表明,LWRS優于每個啟發式信号及其組合,并且在一些情況下表現與一些監督方法相當。此外,LWRS在一個數據集上訓練後,還能有效地應用于其他數據集,包括其他語言的數據集,具有良好的泛化能力和廣泛應用的潛力。該論文發表在SIGIR2023會議上,歡迎對該研究感興趣的同行來信交流:jzw@nju.edu.cn。


蘇州校區

地址:蘇州市太湖大道 1520 号

郵編:215163    歡迎來到bat365在线平台官方网站,bat365在线登录入口!

版權所有©bat365中文官方网站(正版)登录入口 All Rights Reserverd

網站制作:bat365在线平台官方网站,bat365在线登录入口

Baidu
sogou