在計算機網(wǎng)絡領域的國際頂級學術會議——ACM SIGCOMM 2024和USENIX NSDI 2024上,騰訊公司連續(xù)取得突破,共有五項前沿網(wǎng)絡技術研究成果被接收并發(fā)表。這一成就不僅彰顯了騰訊在計算機軟件與網(wǎng)絡技術服務領域雄厚的研發(fā)實力,也標志著中國科技企業(yè)在全球基礎技術研究,特別是在軟件定義網(wǎng)絡(SDN)、數(shù)據(jù)中心網(wǎng)絡、可編程網(wǎng)絡等核心方向,已進入國際領先梯隊,正從技術應用者向原始創(chuàng)新驅動者轉變。
這五項成果聚焦于解決超大規(guī)模數(shù)據(jù)中心與云計算環(huán)境下的關鍵性能與效率瓶頸,體現(xiàn)了騰訊將前沿學術研究與產(chǎn)業(yè)實際需求深度融合的技術路徑。
成果一:超低時延、高吞吐的數(shù)據(jù)中心網(wǎng)絡傳輸協(xié)議優(yōu)化
該項研究針對現(xiàn)有TCP等協(xié)議在高速RDMA網(wǎng)絡中的不足,提出了一種全新的擁塞控制與流量調度算法。它通過精細化的端到端感知與智能預測,在極端高并發(fā)、突發(fā)流量的場景下,實現(xiàn)了接近理論極限的傳輸效率與近乎恒定的超低時延,為高性能計算、AI訓練、金融交易等對網(wǎng)絡延遲極度敏感的核心業(yè)務提供了堅實的底層支撐。
成果二:基于可編程交換機的網(wǎng)絡故障智能診斷與自愈系統(tǒng)
面對數(shù)據(jù)中心網(wǎng)絡規(guī)模日益龐大、拓撲日趨復雜帶來的運維挑戰(zhàn),該研究創(chuàng)新性地利用P4等語言賦予的數(shù)據(jù)平面可編程能力,設計了一套實時、精準的網(wǎng)絡故障檢測、定位與輕量級自愈框架。系統(tǒng)能在微秒級內感知異常并觸發(fā)預置的修復邏輯,大幅縮短了平均故障恢復時間(MTTR),提升了整個數(shù)據(jù)中心服務的可用性與可靠性,是“自動駕駛網(wǎng)絡”理念的重要實踐。
成果三:面向異構算力集群的統(tǒng)一高效互聯(lián)架構
隨著AI大模型訓練、科學計算等任務推動CPU、GPU、NPU等多種異構算力協(xié)同工作,算力集群內部的通信成為新的性能瓶頸。該研究提出了一種軟硬件協(xié)同設計的互聯(lián)架構,通過創(chuàng)新的網(wǎng)絡協(xié)議棧和資源調度策略,屏蔽底層硬件差異,為上層應用提供統(tǒng)一、高效、可擴展的通信抽象,顯著提升了異構算力整體的利用率和任務執(zhí)行效率。
成果四:廣域網(wǎng)(WAN)流量工程與資源調度的強化學習模型
管理全球分布的多個數(shù)據(jù)中心之間的流量(WAN流量)是一項成本高昂且復雜的任務。該研究將深度強化學習(DRL)應用于WAN流量工程,構建了一個能夠持續(xù)學習網(wǎng)絡狀態(tài)變化、業(yè)務需求波動以及鏈路成本的自適應調度模型。該模型能動態(tài)優(yōu)化流量路徑,在保障關鍵應用服務質量(QoS)的前提下,實現(xiàn)帶寬資源利用的最優(yōu)化和運營成本的最小化。
成果五:安全與隱私保護增強的可編程網(wǎng)絡數(shù)據(jù)平面
在可編程網(wǎng)絡帶來靈活性的其安全性也面臨新挑戰(zhàn)。該研究著眼于數(shù)據(jù)平面本身的安全加固,設計了一套內生于可編程交換芯片的輕量級安全原語與執(zhí)行機制。它能夠在高速轉發(fā)的對數(shù)據(jù)包進行高效的加密狀態(tài)驗證、異常流量過濾和隱私敏感信息脫敏處理,為云上多租戶環(huán)境提供了從硬件底層出發(fā)的、更高等級的安全隔離與保障。
技術服務的產(chǎn)業(yè)價值與展望
這些發(fā)表于SIGCOMM和NSDI的成果,絕非停留在紙面的學術構想。它們根植于騰訊云遍布全球的超大規(guī)模數(shù)據(jù)中心和豐富業(yè)務場景的錘煉,其核心思想與技術模塊已逐步融入騰訊云的網(wǎng)絡產(chǎn)品與服務中,轉化為提升云服務性能、穩(wěn)定性和安全性的直接動力。例如,更快的網(wǎng)絡意味著更短的AI模型訓練時間,更智能的運維意味著更穩(wěn)定的在線服務,更高效的廣域網(wǎng)調度意味著更低的客戶成本。
此次五項成果齊獲認可,是騰訊長期堅持投入基礎研究、構建“產(chǎn)學研用”閉環(huán)的縮影。它表明,頂尖的互聯(lián)網(wǎng)科技企業(yè)正在成為推動全球計算機網(wǎng)絡技術演進的重要力量。隨著算網(wǎng)融合、智算網(wǎng)絡等趨勢深入,騰訊將繼續(xù)深耕網(wǎng)絡技術“無人區(qū)”,通過持續(xù)的基礎軟件與技術服務的創(chuàng)新,不僅為自身海量業(yè)務與騰訊云客戶賦能,也為全球計算機網(wǎng)絡技術社區(qū)貢獻更多源自中國的智慧與方案。