我院軟件與社會計算團隊董紅斌教授為第一作者的論文《一種基于關聯信息熵度量的特種選擇方法》于2016年在《計算機研究與發展》期刊發表。2021年入選“中國精品科技期刊頂尖學術論文-領跑者5000”(F5000)。
該文面向特征選擇問題,即從原始特征中選擇一個能夠在機器學習任務中提供近似或更優的小規模特征子集。提出将數據融合領域中的關聯信息熵理論應用到特征選擇中,利用特征與類别的互信息與特征對組合構建特征相關矩陣,充分考慮了不同特征的多變量關系。該方法突破了傳統信息論方法難以考慮特征組合效應的難題,且在分類精度和運行速度上具備穩定的性能,對于擁有海量數據的應用系統,該方法有助于提升系統效率,有重要的研究價值。
“領跑者5000-中國精品科技期刊頂尖學術論文平台(Frontrunner 5000, F5000)”是中國科技信息研究所推出的一款推薦平台,集中對外展示和交流我國的優秀學術論文。該項目入選論文的第一個條件是進入核心期刊各學科被引次數前1%的論文,第二個條件是精品期刊的論文。“精品期刊頂尖論文平台——領跑者5000”項目是中國科學技術信息研究所開展,項目從前五年精品期刊發表的論文中擇優選取。“領跑者5000”将利用WOK國際檢索系統平台,與SCI數據庫在同一平台内實現文獻鍊接和國際引文檢索,在更大範圍内向世界科技同行展示和推廣我國最重要的科研成果。通過“領跑者5000”我國國内的優秀期刊科技論文,特别是以中文寫作的論文,将會被推向國際科技大舞台,讓更多的人了解中國科技。