MME-CoT:專為評估大型多模態模型CoT推理能力的基準測試。涵蓋了數學、科學、OCR、邏輯、時空和一般場景6個領域
隨著LLMs的快速發展,其在推理能力方面的表現引起了廣泛關注。近年來,CoT作為一種有效的推理方法,在LLMs中取得了顯著成果。然而,對于LMMs而言,CoT推理的影響和效果仍缺乏系統評估。LMMs結合了語言和視覺信息處理能力,在圖像識別、視頻理解等視覺任務中表現出色,但其在多模態推理任務中的表現尚
s1K 數據集:是一個用于提升語言模型推理能力的高質量數據集。包含 1,000 個問題,每個問題都配有詳細的 推理路徑 和 答案。
近年來,語言模型(LMs)在大規模預訓練的基礎上取得了顯著進展,其性能提升主要依賴于訓練時計算資源的增加。然而,隨著模型規模的不斷擴大,訓練成本也急劇上升。為了在有限的資源下進一步提升模型性能,研究者們開始探索一種新的范式——測試時擴展(test-time scaling),即在推理階段增加計算資源
UniScene:以占用為中心的統一駕駛場景生成
生成高保真、可控和帶注釋的訓練數據對于自動駕駛至關重要。現有方法通常直接從粗略的場景布局生成單一數據形式,這不僅無法輸出各種下游任務所需的豐富數據形式,而且難以建模直接的布局到數據分布。UniScene 是一個用于生成駕駛場景中三種關鍵數據形式(語義占用、視頻和激光雷達)的統一框架。UniScene
Omni-Scene:以自我為中心稀疏視圖場景重建的全高斯表征
本文對不同的表征進行深入分析,并引入**全高斯(Omni-Gaussian)**表征和定制的網絡設計來補充它們的優勢并彌補缺點。實驗表明,該方法在以自我為中心重建方面明顯優于 pixelSplat 和 MVSplat,并且在以場景為中心的重建方面取得了與先前研究相當的性能。此外,利用擴散模型擴展該方
-
共1頁 4條
