我院蔣智威老師課題組在序列标注技術研究方面取得新進展:提出一種面向少樣本場景的序列标注技術,該技術可以被廣泛地應用于命名實體識别和槽位填充等序列标注任務中。
傳統的序列标注方法通常是監督方法,需要大量帶标簽的數據進行訓練。然而,在一些真實場景中,獲取帶标簽數據是費時費力且昂貴的,這限制了傳統序列标注方法在一些真實場景中的應用。少樣本場景下的序列标注可以緩解對帶标簽數據的需求問題,旨在僅基于少量帶标簽樣本來識别新類别。現有方法主要通過設計基于度量學習的詞元級或跨度級标注模型來解決數據稀缺問題。然而,這些方法僅在單一粒度(即詞元級或跨度級)上進行訓練,并具有相應粒度的一些缺點。針對這些問題,蔣智威老師課題組在研究工作中考慮統一詞元級或跨度級監督信息,并提出一種用于少樣本序列标記的一緻對偶自适應原型(CDAP)網絡。CDAP包含詞元級網絡和跨度級網絡,共同在不同粒度上進行訓練。為了調整兩個網絡的輸出,該工作進一步提出一種一緻損失,使兩個網絡能夠相互學習。此外,在推斷階段,該工作還設計了一種一緻貪婪推斷算法,首先調整預測概率,然後貪婪地選擇具有最大概率的非重疊跨度。大量實驗表明,該工作所提出的模型在三個基準數據集上取得了新的最先進結果。
該研究工作相關成果《Unifying Token- and Span-level Supervisions for Few-shot Sequence Labeling》已在信息檢索領域頂級國際期刊 ACM Transactions on Information Systems(TOIS2024, CCF-A類期刊)上發表。歡迎對該研究感興趣的同學和學術同行來信交流:jzw@nju.edu.cn。