<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      業界 正文
      發私信給nebula
      發送

      0

      國產大模型全陣容,中文大模型競技場推出!

      本文作者: nebula 2024-05-31 14:16
      導語:LMSYS Org推出的大模型競技場Chatbot Arena,已成為海外最具公信力的大模型榜單之一,但該榜單中文化程度相對不足。

      LMSYS Org推出的大模型競技場Chatbot Arena,已成為海外最具公信力的大模型榜單之一,但該榜單中文化程度相對不足。近日,上海人工智能實驗室聯合魔搭社區推出中國大語言模型評測競技場Compass Arena,首度集齊國內主流大模型全陣容,阿里通義千問、百度文心一言、騰訊混元、訊飛星火、字節跳動豆包、智譜AI、百川智能、零一萬物、月之暗面、Minimax、深度求索、書生·浦語等20款國產大模型出戰,角逐中國大模型“最強王者”。

      相比考題固定的傳統測評,大模型競技場采用盲測、開放的測評模式,可以更全面地檢驗模型實力。Compass Arena設置了隨機、匿名對戰,大模型選手們成為“蒙面唱將”,模型信息隱去后,由系統隨機匹配進行PK,用戶可以天馬行空自由出題,并作為評委主觀評判和投票。如果大模型不小心“自報家門”,則對話被過濾,不計入成績。通過成千上萬輪PK挑戰和用戶投票,系統將對大模型進行自動排名。

      國產大模型全陣容,中文大模型競技場推出!

       魔搭社區直播時,網友腦洞大開在線出題 

      Compass Arena由上海人工智能實驗室OpenCompass司南評測體系與魔搭社區聯合建設,前者負責組織評測,后者負責開源模型引入及社區打造。據上海人工智能實驗室OpenCompass團隊介紹,Compass Arena力求體現社區用戶的真實反饋,評測機制借鑒Chatbot Arena,采用Elo評分系統,即國際象棋等對弈活動評估的權威標準。在這種模式下,大模型競技類似“在游戲中打排位”,勝率成為評估模型水平的關鍵指標,同時隨著排位變高,系統也會自動匹配高段位選手進行對戰。

      與Chatbot Arena相比,Compass Arena更聚焦中文大模型,主流國產大模型全覆蓋,同時評測用戶大多使用中文,可以充分評估國產大模型的性能。

      目前,Compass Arena已匯聚超20款商業及社區模型,包括Qwen-Max、ERNIE-4.0-8K、Spark3.5 Max、Abab6.5、GLM4等國內頭部廠商的旗艦款大模型,并引入了Llama3、Mixtral等海外標桿模型進行參照。更多模型及廠商還在不斷加入中。

      上線不到一周,已有上萬人訪問魔搭Compass Arena頁面。魔搭社區表示,歡迎廣大開發者和網友參與大模型排位賽的投票,共同促進國產大模型的進步和趕超。后續,Compass Arena首期排行榜將揭曉,并將定期公布更新。

      魔搭社區Compass Arena鏈接:https://www.modelscope.cn/studios/opencompass/CompassArena

      Compass Arena首批大模型名單:

      Abab6.5-Chat (MiniMax)

      Baichuan 4 (百川智能)

      C4AI Command R+ (Cohere)

      DBRX-Instruct (DataBricks)

      Deepseek-LLM-67B-Chat(深度求索)

      Deepseek-MoE-16B-Chat(深度求索)

      Doubao-Pro-4K (字節豆包)

      ERNIE-4.0-8K (百度文心一言)

      GLM4 (智譜AI)

      Hunyuan-Pro (騰訊混元)

      InternLM2系列(上海AILab書生·浦語)

      Llama3系列(Meta)

      Mixtral 8x22B Instruct (Mistral)

      MoonShot-V1-32K (月之暗面)

      Qwen1.5系列 (阿里通義千問)

      Qwen-Max (阿里通義千問)

      Spark3.5-Max (訊飛星火)

      Yi-34B-Chat (零一萬物)

      Yi-Large (零一萬物)

      雷峰網(公眾號:雷峰網)

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 日韩精品一区二区午夜成人版| a片免费视频在线观看| 国产一区二区三区视频| 熟女一区| 国产精品美女久久久久av爽| 两当县| 又爽又黄无遮挡高潮视频网站| 日韩a级?a级| 亚洲狠狠婷婷综合久久| 国产av成人精品播放| 亚洲 欧美 国产 日韩 精品| 国产一在线精品一区在线观看| 野花3观看免费观看视频| 日韩亚洲国产中文字幕欧美| 五月天成人小说| 精品国产一区av天美传媒| 多毛老熟女| 狼人伊人久久| 亚洲无码人妻| 18禁高潮出水呻吟娇喘蜜芽| 老司机亚洲精品一区二区| 呦女亚洲一区精品| 国产人免费人成免费视频| 手机在线免费av网站| 亚洲蜜桃精久久久久久久久久久久 | 成人h动漫精品一区二区樱花动漫| 成人区人妻精品一熟女| 亚韩精品中文字幕无码视频| 在办公室被c到呻吟的动态图| 日本道久久| 中文字幕人妻熟女人妻a片| 极品熟女精品| 亚州精品人妻一二三区| 久久精品| 天天澡天天狠天天天做| 免费看国产精品3a黄的视频| 精品一区二区三区蜜桃久| 日韩激情无码av一区二区| 亚洲一区二区高清在线| 欧美日韩高清在线观看| 亚洲熟妇中文字幕五十中出|