AI運算狂潮來襲!800G到1.6T光互連如何突破伺服器傳輸瓶頸

隨著人工智慧(AI)與機器學習模型的規模急速膨脹,資料中心的運算負載正以前所未有的速度增長。傳統的400G光互連已逐漸無法滿足AI伺服器之間龐大的資料交換需求,傳輸頻寬成為制約整體運算效能的關鍵瓶頸。業界正積極從800G邁向1.6T高速光互連技術,試圖透過更高的傳輸速率與更低的延遲,來解鎖AI訓練與推理的極限。這股技術浪潮不僅關乎光收發模組的升級,更涉及從矽光子、共同封裝光學到新型交換器晶片的整體生態系變革。面對生成式AI與大型語言模型(LLM)的常態化部署,資料中心必須在功耗、成本與密度之間取得平衡,而800G/1.6T光互連正是解決這些矛盾的關鍵路徑。本文將深入探討這項技術如何突破當前的傳輸瓶頸,並為下一世代的AI伺服器鋪平道路。

800G與1.6T光模組的技術演進與核心挑戰

從800G到1.6T的躍進,並非單純的速率翻倍。現行主流800G解決方案多採用8路100G電氣介面(8×100G),透過PAM4調變技術在單一波長上實現100G傳輸。然而要達到1.6T,目前有兩條主要路徑:一是採用8路200G電氣介面(8×200G),二是採用4路400G光學通道(4×400G)。前者需要更高速率的電子元件與更複雜的數位訊號處理,後者則仰賴先進的矽光子整合與多波長技術。其中,200G per Lane的技術難度極高,需要克服通道損耗、串擾與時序抖動等物理限制。此外,隨著傳輸速率攀升,功耗管理也成為嚴峻考驗——每1Tbps的功耗必須控制在10瓦以內,才能滿足資料中心的散熱與營運成本要求。為此,業界正加速發展共同封裝光學(CPO),將光引擎與交換器晶片直接整合在同一封裝內,大幅縮短電氣訊號路徑並降低功耗。

AI伺服器傳輸瓶頸的根本解方:低延遲與高頻寬的雙重突破

AI伺服器的傳輸瓶頸主要體現在兩個層面:一是GPU叢集內部的卡間互連,二是跨機櫃、跨叢集的網路通訊。目前NVIDIA的NVLink與InfiniBand雖能提供高頻寬,但隨著模型參數突破千億級別,這類專用互連的擴展性與成本問題逐漸浮現。800G/1.6T乙太網路光互連的出現,提供了更具彈性與成本效益的替代方案。透過更高密度的光收發器(如OSFP或QSFP-DD800),資料中心可在有限的面板空間內實現數十Tbps的交換容量,同時保持與現有乙太網路基礎設施的相容性。更重要的是,光互連的傳輸延遲可壓低至奈秒等級,這對於需要頻繁同步參數的分散式訓練至關重要。近期業界已成功展示基於1.6T光模組的端到端AI訓練場景,證實其在減少通訊等待時間、提升GPU利用率方面的顯著效果。

生態系統整合與台灣產業的戰略機遇

800G/1.6T光互連的商用化並非一蹴可幾,需要上游晶片設計、封裝測試、模組製造與雲端服務商的緊密協作。台灣在半導體封測、光通訊與電子製造領域擁有深厚底子,許多業者正積極切入矽光子晶圓級封裝與CPO模組的代工服務。例如,部分封測大廠已開始量產用於800G光模組的高速驅動器與TIA晶片,並布局下一代200G per Lane的測試解決方案。另一方面,工研院等研究機構也主導成立光互連產業聯盟,推動從材料、設備到系統驗證的完整供應鏈在地化。隨著AI伺服器出貨量持續攀升,台灣有機會在高速光互連標準制定與製造環節扮演關鍵角色,甚至主導部分規格走向。然而,人才短缺與先進製程的投資門檻仍是挑戰,需要政府與企業共同投入資源,才能在這波AI基礎設施升級浪潮中奪得先機。

【其他文章推薦】
買不起高檔茶葉,精緻包裝茶葉罐,也能撐場面!
SMD electronic parts counting machine
哪裡買的到省力省空間,方便攜帶的購物推車?
空壓機這裡買最划算!
塑膠射出工廠一條龍製造服務
告別頻繁維修!5 個延長堆高機電池與壽命的日常保養祕訣