近日,云從科技從容大模型在綜合評測權(quán)威平臺OpenCompass的多模態(tài)評測領域中取得重大進展。
最新評測結(jié)果顯示,云從科技的從容大模型在該體系中的平均得分為65.5,這一成績使得從容大模型躋身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,僅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9)。而在國內(nèi)市場,從容大模型的成績也超過了InternVL-Chat(61.7)和GLM-4V(60.8),排名首位。
圖1:OpenCompass多模態(tài)榜單
OpenCompass大模型開放評測體系是上海人工智能實驗室推出的完整開源可復現(xiàn)的評測框架。OpenCompass多模態(tài)評測方面采用了8個具有代表性的數(shù)據(jù)集,從多種視角客觀量化多模態(tài)大模型的能力,評估維度覆蓋目標檢測、文字識別、動作識別、圖像理解和關系推理、藝術(shù)與設計、商業(yè)、科學、健康與醫(yī)學、人文與社會科學、技術(shù)與工程、數(shù)學推理等多個方面。
圖2:從容大模型-2.0多模態(tài)能力示例
在本次測評中,從容大模型在其中的6個數(shù)據(jù)集表現(xiàn)優(yōu)異,排名國內(nèi)第一(MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench),尤其是在OCRBench測試集上以取得全球最高的827分(總分為1000分),且高于第二名GLM-4v 13分,進一步提升從容大模型在文本識別、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵信息提取等業(yè)務場景下的適用性。
圖3:OpenCompass中國大模型多模態(tài)能力展示
從容大模型在此體系中的優(yōu)秀表現(xiàn),依賴云從科技自研的高效多模態(tài)處理架構(gòu)和先進的計算技術(shù),實現(xiàn)了高效的多模態(tài)數(shù)據(jù)處理能力,能夠在視覺和語言任務之間實現(xiàn)高效的融合和切換,并最大化利用計算資源,保證在處理大規(guī)模多模態(tài)數(shù)據(jù)時仍能保持較高的性能和響應速度,使得模型的訓練過程更加高效,收斂速度更快,性能更穩(wěn)定。
同時也得益于云從科技長期在視覺、語言領域的深厚積累和不斷創(chuàng)新。
圖4:從容大模型-2.0多模態(tài)能力示例
此前,從容大模型已在視覺、跨模態(tài)領域10次刷新世界紀錄,綜合性能經(jīng)第三方SuperClue、C-Eval等綜合評測,位列全球前五。
作為一家專注于人機協(xié)同技術(shù)研發(fā)的平臺企業(yè),云從科技一直在積極推動AI智能體及大模型技術(shù)的發(fā)展和應用。
隨著人工智能技術(shù)的迅猛發(fā)展,多模態(tài)大模型已成為驅(qū)動產(chǎn)業(yè)變革的核心引擎。此次從容大模型在OpenCompass大模型開放評測體系中的出色表現(xiàn),不僅是對云從科技技術(shù)創(chuàng)新實力的認可,更在業(yè)界樹立典范,激勵全球科技企業(yè)在新一輪的人工智能競爭中勇攀高峰。
近日,拉薩高新區(qū)(柳梧新區(qū))(以下簡稱“拉薩高新區(qū)”)憑借與云從科技攜手創(chuàng)新的智慧食安監(jiān)管平臺,成功獲得了2024年西藏自治區(qū)食品安全工作先進集體稱號。
在推動科技創(chuàng)新與產(chǎn)業(yè)發(fā)展雙向互促的背景下,重慶市經(jīng)濟信息委于近日公布了首批17個產(chǎn)業(yè)創(chuàng)新綜合體(科技型企業(yè)主導型)建設單位名單。 云從科技憑借其在AI智能體領域的核心技術(shù)優(yōu)勢與產(chǎn)業(yè)生態(tài)構(gòu)建能力,成功入選并成為“產(chǎn)業(yè)大模型與智能體系統(tǒng)產(chǎn)業(yè)創(chuàng)新綜合體”的牽頭單位之一。
在此次項目中,云從科技將為廣州銀行提供定制化的鴻蒙版SDK,幫助廣州銀行實現(xiàn)用戶身份驗證等核心功能的優(yōu)化,確保手機銀行應用在數(shù)據(jù)安全、交易安全等方面達到最高標準,全面提升用戶的金融體驗。
周一到周五9:30-18:00(北京時間)

商務合作:[email protected]

媒體合作:[email protected]

渠道合作:[email protected]

人才招聘:[email protected]