|
大腦通過神經元之間的電化學信號傳遞實現信息處理功能,這一生物機制在計算機領域得到了數學化的抽象表達。以 DeepSeek、ChatGPT 等大語言模型為例,它們本質上是在高維數學空間中構建信息互聯網絡,通過矩陣運算等數學操作模擬神經元的計算功能。
上海理工大學顧敏院士和張啟明教授團隊近期的一項研究實現了重要的范式突破——利用光傳播的物理特性構建了光學神經元之間的連接網絡,首次在光學系統中完整實現了神經網絡的計算功能。
研究人員通過利用三維雙光子納米光刻技術集成微型光學衍射神經網絡(DN2s, Diffractive Neural Networks)和多模光纖,在一根 0.35 米長的多模光纖的遠端面上開發了一款尺寸僅為 150 微米×150 微米的新型 AI 芯片,光學神經元密度達 106 個神經元/立方厘米。
該技術的創新性體現在多個方面:
首先,在硬件層面,光學神經網絡擺脫了對傳統電子芯片的依賴。與需要大量 GPU 堆疊的大模型訓練不同,該技術通過光學多層神經網絡的光連接過程直接實現計算功能,這一技術路徑為 AI 算力提供了新的方向。
其次,在具體應用場景中這項技術也展現出顯著優勢,例如在多模光纖圖像傳輸場景下,系統可不依賴傳統 CPU 即可完成同等功能。
值得關注的是,該技術直接通過光纖實現了全光學圖像傳輸,成像速度約為 100 幀/秒,且訓練資源需求極低,僅需不到 4 萬個超參數和 4-6 小時的訓練時間。與同體積的傳統光纖相比,光纖傳輸的信號通量提升了約 1 萬倍,圖像最小分辨率達 14 微米,在點對點圖像傳輸模式下分辨率可提升至 1.5 微米。
這意味著在接近頭發絲直徑(約 100 微米)的圓形光纖通道中,系統能精確傳輸約 1 萬個信號點,而當前互聯網廣泛使用的單模光纖僅能傳輸單個信號點。 這項技術有望在多個領域產生革命性影響。顧敏院士對 DeepTech 表示,這種數量級的性能躍遷有望實現接近 8G 量級的信號傳輸通量,為從現有 5G/6G 向更高階通信標準的發展提供了關鍵技術支撐。
在量子信息處理領域,基于光學 AI 芯片的解決方案或能顯著提升短距離量子計算芯片的信號傳輸與信息恢復能力。該課題組正在探索該技術與量子通信的融合應用,目前已完成片上多層神經網絡結構的集成驗證,并在開展基于該芯片平臺的量子密鑰分發研究。 其次,醫學內窺鏡成像方面,在研究大腦神經活動時,可作為一種類似微針的細小內窺鏡探頭(直徑僅約 100 微米),在不損傷受體大腦組織的前提下,對活體神經元在信息處理過程中的動態情況進行觀測。
這一突破性進展不僅為大腦功能研究提供了全新工具,更有望將診療范圍擴展到傳統胃鏡難以觸及的狹窄解剖區域,如胰腺導管、小腸隱窩等特殊部位,為現有內窺鏡檢查的技術盲區提供新的解決方案。 顧敏曾任澳大利亞斯威本大學副校長及杰出教授、澳大利亞研究委員會桂冠教授;澳大利亞皇家墨爾本理工大學副校長及杰出教授。他于 2019 年年末全職回國,現任上海理工大學校務委員會執行主席、光子芯片研究院院長、教授。主要研究領域包括現代光子學,光電子成像和物理光學等。
在光子技術領域,多模光纖因其高容量信息傳輸能力而備受關注。然而,多模光纖的高散射特性使得直接通過光纖傳輸圖像變得極具挑戰性。
該研究源于研究人員在 2021 年年初提出的疑問:是否能夠有效解決多模光纖信息傳輸過程中的散斑效應?為此,他們提出并驗證了多種解決方案,包括算法優化以及利用光學人工智能等方法。
經過系統評估,研究人員最終選擇了基于光學神經網絡的解決方案,這是一種被動式的多層神經網絡架構,其兼具速度快和能耗低的顯著優勢。從本質上來看,該方法利用光學神經網絡對光場在傳輸過程中產生的畸變進行校正,進而恢復因多模光纖散射而失真的圖像。
這與我們日常生活中使用的花灑噴頭類似,水流在管道中的流動狀態具有不確定性,多模光纖中的光傳輸同樣存在復雜的散射現象。
該論文第一作者、上海理工大學蔚浩義特聘副教授解釋說道:“我們設計的這種結構相當于具有光學神經網絡功能的智能花灑,能夠動態調整光的傳播路徑,使其恢復到初始的規整狀態。” 該課題組希望將多模光纖與光學神經網絡進行系統集成,然而在直徑僅約 100 微米的光纖端面上構建多層神經網絡結構,面臨著巨大的技術挑戰。
為此,研究人員創新性地提出了微納級聯方案:通過將微小的多層神經網絡結構級聯組合,并將其集成在 CMOS 芯片上。這種設計只需將多模光纖與芯片進行三維空間的機械對準,即可顯著提升系統的圖像恢復能力。
值得注意的是,這種性能提升呈現指數增長趨勢——從當前的三層結構擴展到十層結構時,信息處理能力有望實現質的飛躍。“據我們預計,該方案不僅能有效解決光纖彎曲帶來的信號失真問題,還能應對信息通量持續增長的技術需求。”蔚浩義表示。 研究人員采用此前該團隊自主研發的三維納米級激光打印技術,為實現微小光學神經網絡結構奠定了重要的基礎。
傳統的 GPU 芯片中所使用的光刻技術只能在二維平面上進行刻蝕,如果想用傳統的方法實現三維刻蝕,需要進行非常復雜的類似于搭積木的多層疊加工藝。
而三維納米激光打印技術最大的優勢在于,其能夠實現納米級精度的一體成型打印。這意味著,研究人員能夠在 100 微米大小的光纖端面上,精確加工出任意的復雜光學結構。
值得關注的是,該技術的最小加工分辨率可達 9 納米,并能夠穩定實現十幾納米的加工精度。這不僅在國內處于領先地位,也為光學神經網絡的微型化提供了關鍵技術支撐。
盡管此前技術方面已有一定基礎但不容忽視的是,相關系統還不完善。于是,蔚浩義帶領課題組成員投入了很多精力“純手工”打造出了這個系統。在此基礎上,研究團隊成功制造出了體積小、性能高的光學神經網絡芯片。這種芯片不僅在圖像傳輸的分辨率上表現出色,還能夠在彎曲光纖的情況下保持較穩定的傳輸性能。 該技術的實現也離不開研究人員對光纖彎曲技術的持續攻關。在探索性實驗中,他們嘗試通過控制光纖彎曲角度來優化傳輸性能,但發現現有方法存在固有局限:由于無法將所有可能的彎曲狀態都納入神經網絡的訓練數據集,系統的適應能力受到制約。也就是說,神經網絡的“智能度”是有限的。
針對這一挑戰,研究人員創造性地提出了光電融合的解決方案:一方面,充分發揮光神經網絡在信息處理速度和能效比方面的優勢;另一方面,通過級聯在計算機上預訓練的電神經網絡,構建混合計算架構來協同處理光纖彎曲導致的復雜圖像畸變問題。這一創新思路為突破現有技術瓶頸提供了新的研究方向。
此外,通過空間光調制器投射的 HeLa 細胞圖像的直接光學傳輸還展示了遷移學習,這些圖像并不在訓練數據集中。審稿人一致認為這項研究具有重要的應用價值。
最終,相關論文以《通過多模光纖使用遠端面微型衍射神經網絡實現全光圖像傳輸》(All-optical image transportation through a multimode fibre using a miniaturized diffractive neural network on the distal facet)為題發表在 Nature Photonics 上 [1]。
上海理工大學蔚浩義特聘副教授是第一作者,張啟明教授和顧敏院士擔任共同通訊作者。目前,相關代碼和數據已開源 在轉化應用方面,課題組已利用該技術成功實現細胞組織的高分辨率成像與圖像傳輸,目前正與多家醫療機構合作推進臨床前研究,預計將于今年內完成實驗室級內窺鏡系統的原型開發。
技術的產業化進程也取得了重要進展,據介紹,紅杉資本已與該團隊達成戰略合作,將在技術成熟階段直接參與產業化孵化,加速其從實驗室走向臨床應用。
目前,生物細胞圖像信息與神經網絡的結合已能實現預期功能。為進一步提升醫療體驗,研究人員正致力于縮小內窺鏡探頭的尺寸,使其在體內幾乎無感。然而,玻璃材質的光纖存在斷裂風險,可能對患者造成傷害,因此研究人員正聚焦于解決光纖涂層的技術難題,確保其即使斷裂也不危及患者安全。
這一技術突破需要與新興的光學計算范式相結合。衍射神經網絡憑借其快速計算和低能耗特性,盡管它不能完全取代電子芯片,但能在特定信息通量處理方面可彌補 GPU 的不足,為解決能耗問題提供新思路,有望發展為未來光學計算的新范式。
在技術融合層面,光刻技術與多層神經網絡的結合未來有望形成完整的產業鏈。該產業鏈可參照電子芯片模式:上游以三維激光納米打印光刻機等光刻技術為核心,配套光刻膠等材料研發;下游則針對不同功能的神經網絡芯片進行開發。
這種架構涉及材料科學、電子工程等多學科的協同。其中,衍射神經網絡的光學特性與光刻技術的微納加工能力形成天然互補。通過整合光纖涂層、光學計算和光刻工藝等技術,不僅能推動醫療內窺鏡的微型化發展,還有可能帶動從基礎材料到終端應用的完整產業鏈升級。
|