學院資訊
學院新聞
現在位置: 首頁  學院資訊  學院新聞
  • 我院馬歡飛副教授在國際頂級期刊《PNAS》發表研究論文
  • 瀏覽量:2166 發布人:佚名 發布時間:2018-10-11
  • 2018年10月8日,國際著名綜合類科學期刊《美國科學院院刊》(PNAS)在線發表了蘇州大學數學科學學院系統生物學研究中心馬歡飛副教授研究課題組的題為“Randomly Distributed Embedding Making Short-termHigh-dimensional Data Predictable”的最新研究論文(自由投稿渠道),馬歡飛副教授是該論文第一作者,蘇州大學數學科學學院是唯一第一作者單位。PNAS與Cell,Nature,Science被公認為世界四大著名科學期刊,這是我校首次在PNAS發表數學類論文。

     

    該項研究成果提出了基于非線性動力學的全新隨機嵌入理論和方法——隨機嵌入分布方法(RDE: Randomly Distributed Embedding),通過大量隨機低維嵌入映射的構造獲得目標變量預測值的分布,最終使得高維短序列時間序列數據的預測成為可能,從而建立了由短時間觀測的高維數據,預測目標變量動態行為的全新理論和方法。

    在時間序列分析中,一般認為在獲得低維系統的大量時間樣本(時間序列數據)后,系統的重構或者預測是可行的,而短的時間樣本數據一般是不可預測。但是在大數據時代,在研究復雜系統時,我們往往獲得大量的變量和有限的時間樣本(如影像數據或組學數據)。一方面高維變量使得系統的擬合所需要的參數快速增長帶來維度災難,另一方面相對較短的時間域樣本往往不能獲得完整的系統動力學行為統計規律,這就對數據分析方法提出了新的挑戰。

     

            圖1:即使學習數據只是吸引子的一部分樣本,但RDE可以預測那些沒有學習過的動態行為。放大圖:基于分布的預測過程。

     

    基于這個問題,該項研究使用非線性動力系統的嵌入理論(embedding theory)設計了全新的復雜系統預測框架,使用大量低維嵌入映射來構造弱預測器,在大量弱預測器的基礎上構造強預測器,從而避免了維度災難,并由高維系統中不同變量間的交互作用構建目標變量的動態信息,彌補了短時間樣本的信息不足。該項研究從理論上給出了該框架的可行性分析,并通過基因表達數據、空氣污染、疾病數據與氣象數據等實際數據的預測進一步驗證了該方法的可行性和優越性。

     

    該工作對于大數據的分析,特別是高維短序列的時間序列數據分析提供了全新的概念和理論,不僅可用于時間序列的預測,也可應用于人工智能及腦科學中的大樣本數據構建和全新學習建立等。

     

    馬歡飛老師2010年于復旦大學獲得博士學位后入職蘇州大學數學科學學院,2012年赴東京大學從事博士后研究,近年來主要從事非線性科學和系統生物學的研究,在數據的因果檢測、預測和系統重構方面取得了一系列研究成果。該研究獲得了國家自然科學基金重大研究計劃和面上項目的經費支持。

     

     

    論文信息:“Randomlydistributed embedding making short-term high-dimensional data predictable Huanfei Ma, Siyang Leng, Kazuyuki Aihara, Wei Lin, Luonan Chen,Proceedingsof the National Academy of Sciences, Oct 2018, 201802987; DOI:10.1073/pnas.1802987115

     

    論文鏈接:http://www.pnas.org/content/early/2018/10/04/1802987115

     


蘇州大學數學科學學院 Copyright 2016.All Rights Reserved. 管理后臺
電話:0512-65112637 傳真:0512-65112637  E-mail:sxxy@suda.edu.cn  地址:蘇州市十梓街1號 郵編:215006 蘇ICP備06032411號
一道本日本视频无码