0
今日獲悉,騰訊云數據庫4篇論文入選國際數據庫頂級會議VLDB,多項優化創新方案突破了數據庫領域的性能瓶頸數等多項難題,技術創新能力再獲國際權威認可。
VLDB(International Conference on Very Large Data Bases)是數據庫研究領域歷史悠久的國際會議,與ICDE和SIGMOD并稱數據庫三大頂級會議,每年為數據庫領域提供大量高質量的研究論文和研究成果,具有重要的學術價值和行業引導意義。
近些年,隨著新興技術迅猛發展,各行各業產生的數據量呈爆炸式增長分布式、云原生等多種場景數據庫應運而生。與此同時,分布式場景也迎來如何權衡性能與一致性等一系列新的挑戰。
在入選論文——《TDSQL: Tencent Distributed Database System》中,騰訊云分享了設計、開發和優化大規模分布式數據庫系統TDSQL的經驗。在分布式架構上,TDSQL通過大量的實現和優化,包括內核優化、物理復制的實現與優化、分布式鎖的優化等,使得TDSQL能在保持一致性的情況下有效處理大量數據和高并發。在去年3月的TPC-C 基準測試中,TDSQL性能達到每分鐘 8.14 億筆交易(tpmC),打破了世界紀錄。
在高性能的鍵值存儲引擎中,高性能索引結構往往需要占用過量內存以換取極高的索引性能。針對這一熱門研究課題,騰訊云與華中科技大學合作的最新研究成果《FluidKV: Seamlessly Bridging the Gap between Indexing Performance and Memory-Footprint on Ultra-Fast Storage》中提出了一種兼顧高讀寫性能和低內存占用的索引機制。
這種基于動態多階段的索引架構FluidKV,可將索引項從內存占用率高的階段,快速遷移到內存友好的持久存儲階段,利用高性能存儲設備的帶寬減輕內存壓力。在此基礎上,通過匹配IO傳輸粒度,并根據用戶負載讀寫比例優化緩沖等方式,可以讓讀寫性能保持在最高檔位。實驗結果顯示,對比持久索引的相關工作,FluidKV的讀寫性能均處于最高一檔,同時最多可減少90%的內存占用。

(騰訊云數據庫團隊現場分享論文)
此外,騰訊云與北京大學、北京交通大學合作的最新研究成果也入選了2024年VLDB長文,文章《Efficient and Accurate SimRank-based Similarity Joins: Experiments, Analysis, and Improvement》提出了高效且準確的SimRank圖節點相似度連接算法,實驗表明,該算法較已有方法實現了查詢效率近一個數量級的提升。
隨著CPU、大內存、高速存儲設備的發展,讓CPU更多的用于實際的計算任務是高效利用這些新硬件的關鍵之一。但目前,整個數據庫系統中,存在大量的等待事件,會導致CPU“卡住”,即讓CPU處于無效的等待狀態,造成CPU資源的浪費。
在入選論文《The Art of Latency Hiding in Modern Database Engines》中,騰訊云則聯合西蒙·弗雷澤大學,針對高性能的OLTP處理難題,提出了基于雙隊列的流水線事務處理機制,可以進一步減少CPU的無效等待,讓CPU充分應用于實際的計算任務中。實驗表明,在數據量大于內存、混合負載的場景下,該系統可取得33倍的性能提升。
作為國內數據庫行業先行者,騰訊云已經深耕數據庫領域十余年,服務超過50萬客戶,未來,騰訊云將持續深耕實際場景需求,不斷探索與攻堅數據庫難題,推動數據庫領域的學術進步與技術成果轉化,助力更多企業實現業務創新與高質量發展。
雷峰網(公眾號:雷峰網)
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。