Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

AI
5月30日
编辑

故渊

google在 I / O 2024 开发者大会上，宣布将 Gemini 1.5 Pro 上下文窗口增加至 200 万个 tokens，那么 Gemini 1.5 Pro 性能究竟有多刁悍？根据 LMSYS Org 公布的总排行榜对比，通过 Arena Elo 体系的测量，Gemini-1.5-Pro-API-0514 和 Gemini-Advanced-0514 都靠近 GPT-4o。上述两款模型在中文方面的体现也极度优秀，Gemini 1.5 Pro 在“hard prompts”类别中也极度靠近。IT之家注：Aren

google在 I / O 2024 开发者大会上，宣布将 Gemini 1.5 Pro 上下文窗口增加至 200 万个 tokens，那么 Gemini 1.5 Pro 性能究竟有多刁悍？

Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

根据 LMSYS Org 公布的总排行榜对比，通过 Arena Elo 体系的测量，Gemini-1.5-Pro-API-0514 和 Gemini-Advanced-0514 都靠近 GPT-4o。

Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

上述两款模型在中文方面的体现也极度优秀，Gemini 1.5 Pro 在“hard prompts”类别中也极度靠近。

Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

Arena Elo 基准测试：google Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

IT之家注：Arena Elo 体系通过让用户匿名投票决定哪个模型在随机对战中体现更好来衡量大型语言模型（LLMs）的技能，并像国际象棋中的 Elo 体系一样更新用户的评分，整体而言更加客观。

给TA打赏

共{{data.count}}人

人已打赏

1.5 Arena Elo Gemini Pro

欧盟宣布建立人工智能办公室，对 AI 举行禁锢

2024-5-30 9:12:17

220 亿参数，Mistral AI 发布编程大模型 Codestral：支持 Python 等 80 多种言语

2024-5-30 12:28:48

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
TOP2

平安人寿ChatBI：大模型智能化报表的深度实践
12月4日
TOP3

ChatGPT遇到这些人名开始自闭，OpenAI回应了
12月4日
字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片
12月5日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发
12月4日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部