近日,云從科技從容大模型在綜合評測權威平臺OpenCompass的多模態評測領域中取得重大進展。
最新評測結果顯示,云從科技的從容大模型在該體系中的平均得分為65.5,這一成績使得從容大模型躋身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,僅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9)。而在國內市場,從容大模型的成績也超過了InternVL-Chat(61.7)和GLM-4V(60.8),排名首位。
圖1:OpenCompass多模態榜單
OpenCompass大模型開放評測體系是上海人工智能實驗室推出的完整開源可復現的評測框架。OpenCompass多模態評測方面采用了8個具有代表性的數據集,從多種視角客觀量化多模態大模型的能力,評估維度覆蓋目標檢測、文字識別、動作識別、圖像理解和關系推理、藝術與設計、商業、科學、健康與醫學、人文與社會科學、技術與工程、數學推理等多個方面。
圖2:從容大模型-2.0多模態能力示例
在本次測評中,從容大模型在其中的6個數據集表現優異,排名國內第一(MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench),尤其是在OCRBench測試集上以取得全球最高的827分(總分為1000分),且高于第二名GLM-4v 13分,進一步提升從容大模型在文本識別、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵信息提取等業務場景下的適用性。
圖3:OpenCompass中國大模型多模態能力展示
從容大模型在此體系中的優秀表現,依賴云從科技自研的高效多模態處理架構和先進的計算技術,實現了高效的多模態數據處理能力,能夠在視覺和語言任務之間實現高效的融合和切換,并最大化利用計算資源,保證在處理大規模多模態數據時仍能保持較高的性能和響應速度,使得模型的訓練過程更加高效,收斂速度更快,性能更穩定。
同時也得益于云從科技長期在視覺、語言領域的深厚積累和不斷創新。
圖4:從容大模型-2.0多模態能力示例
此前,從容大模型已在視覺、跨模態領域10次刷新世界紀錄,綜合性能經第三方SuperClue、C-Eval等綜合評測,位列全球前五。
作為一家專注于人機協同技術研發的平臺企業,云從科技一直在積極推動AI智能體及大模型技術的發展和應用。
隨著人工智能技術的迅猛發展,多模態大模型已成為驅動產業變革的核心引擎。此次從容大模型在OpenCompass大模型開放評測體系中的出色表現,不僅是對云從科技技術創新實力的認可,更在業界樹立典范,激勵全球科技企業在新一輪的人工智能競爭中勇攀高峰。
近日,公安部公布了一批2023年科技信息化獲獎成果。云從科技攜手公安部交科所、無錫交警支隊共同申報的創新性科研項目,在歷經嚴格的形式審查、專家評審和公示環節后,最終榮膺公安部科學技術獎三等獎。這也是公安領域最高級別的技術獎項。
近日,由機器之心評選的2024年度人工智能領軍企業榜單正式揭曉,云從科技憑借其在AI技術研發、場景落地應用及商業模式上的卓越表現,成功入選此次榜單。一同入選的還有美圖公司、釘釘、金山辦公、MiniMax以及月之暗面等多家優秀企業。
近日,由中國科技產業智庫甲子光年舉辦的甲子引力年終盛典成功舉辦,大會公布了甲子20系列榜單,旨在表彰 2022-2023 年度在科技產業各細分賽道上擁有核心技術實力,并在商業化上頗有成效的優秀成長型科技公司,云從科技從容大模型憑借在語言、視覺、多模態大模型方面的技術突破與商業化進程入選AI大模型最具商業潛力榜單。
周一到周五9:30-18:00(北京時間)
商務合作:business@cloudwalk.com
媒體合作:Media@cloudwalk.com
渠道合作:business_partner@cloudwalk.com
人才招聘:zhaopin@cloudwalk.com