国产一级片一区二区三区,久久久久久久久久99精品,久久精品日韩

云從科技在權威多模態大模型評測體系OpenCompass排名中國第一全球第三

2024-06-27

back

近日，云從科技從容大模型在綜合評測權威平臺OpenCompass的多模態評測領域中取得重大進展。

最新評測結果顯示，云從科技的從容大模型在該體系中的平均得分為65.5，這一成績使得從容大模型躋身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，僅次于GPT-4o（69.9）和Claude3.5-Sonnet（67.9）。而在國內市場，從容大模型的成績也超過了InternVL-Chat（61.7）和GLM-4V（60.8），排名首位。

圖1：OpenCompass多模態榜單

OpenCompass大模型開放評測體系是上海人工智能實驗室推出的完整開源可復現的評測框架。OpenCompass多模態評測方面采用了8個具有代表性的數據集，從多種視角客觀量化多模態大模型的能力，評估維度覆蓋目標檢測、文字識別、動作識別、圖像理解和關系推理、藝術與設計、商業、科學、健康與醫學、人文與社會科學、技術與工程、數學推理等多個方面。

圖2：從容大模型-2.0多模態能力示例

在本次測評中，從容大模型在其中的6個數據集表現優異，排名國內第一（MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench），尤其是在OCRBench測試集上以取得全球最高的827分（總分為1000分），且高于第二名GLM-4v 13分，進一步提升從容大模型在文本識別、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵信息提取等業務場景下的適用性。

圖3：OpenCompass中國大模型多模態能力展示

從容大模型在此體系中的優秀表現，依賴云從科技自研的高效多模態處理架構和先進的計算技術，實現了高效的多模態數據處理能力，能夠在視覺和語言任務之間實現高效的融合和切換，并最大化利用計算資源，保證在處理大規模多模態數據時仍能保持較高的性能和響應速度，使得模型的訓練過程更加高效，收斂速度更快，性能更穩定。

同時也得益于云從科技長期在視覺、語言領域的深厚積累和不斷創新。

圖4：從容大模型-2.0多模態能力示例

此前，從容大模型已在視覺、跨模態領域10次刷新世界紀錄，綜合性能經第三方SuperClue、C-Eval等綜合評測，位列全球前五。

作為一家專注于人機協同技術研發的平臺企業，云從科技一直在積極推動AI智能體及大模型技術的發展和應用。

隨著人工智能技術的迅猛發展，多模態大模型已成為驅動產業變革的核心引擎。此次從容大模型在OpenCompass大模型開放評測體系中的出色表現，不僅是對云從科技技術創新實力的認可，更在業界樹立典范，激勵全球科技企業在新一輪的人工智能競爭中勇攀高峰。

back

日韩影院在线观看_国产乱子一区二区|HD中文字幕在线播放,国产激情久久久久,欧洲午夜精品,日本人の夫妇交换

智能化AIoT設備

平臺系統

產業發展

AI智能體

數字中國

云從科技在權威多模態大模型評測體系OpenCompass排名中國第一全球第三

您可能感興趣

400-151-5992

數字中國 · 產業發展 · 個人精靈

留言咨詢

提交成功

日韩影院在线观看_国产乱子一区二区|HD中文字幕在线播放,国产激情久久久久,欧洲午夜精品,日本人の夫妇交换

智能化AIoT設備

平臺系統

產業發展

AI智能體

數字中國

云從科技在權威多模態大模型評測體系OpenCompass排名中國第一 全球第三

您可能感興趣

400-151-5992

數字中國 · 產業發展 · 個人精靈

留言咨詢

提交成功

云從科技在權威多模態大模型評測體系OpenCompass排名中國第一全球第三