马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

感谢马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI 表示:“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案
感谢马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。

xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。

xAI 表示:“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案例,,包括将白板上的流程图草图转化为 Python 代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为 CSV 文件格式等等。

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

xAI 还分享了 Grok-1.5V 的跑分情况,在 RealWorldQA 基准测试中,比 GPT-4V、Claude 3Sonnet、Claude 3 Opus 和 Gemini Pro 1.5 等主流竞争对手更为优异。

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

IT之家附上参考地址

Grok-1.5 Vision Preview

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上最聪明的人工智能。

马斯克宣布 Grok 聊天机器人将在本周晚些时候向所有 X Premium 订阅用户开放

感谢埃隆・马斯克今日宣布,xAI 公司的 Grok 聊天机器人将在本周晚些时候向所有 X(原推特)Premium 订阅用户开放,而不仅限于 Premium 订阅用户使用。Grok 聊天机器人由 xAI 公司开发,去年 11 月起开始向 X Premium 订阅用户开放。IT之家此前报道,官方在本月早些时候宣布 3140 亿参数的 Grok-1 以 Apache 2.0 协议开源。随着 Grok 向全部 X Premium 用户开放,X Premium 用户将获得新的 Super Grok 模式。马斯克解释道,

消息称马斯克旗下人工智能公司 xAI 即将完成 60 亿美元最大融资

感谢综合外媒 The Information 和彭博社报道,马斯克旗下人工智能公司 xAI 将在未来两周完成 60 亿美元(IT之家备注:当前约 435 亿元人民币)的新一轮融资。这也是 AI 模型创企中最大的单轮融资之一。xAI 于 2023 年 7 月成立,去年 11 月推出首款产品 Grok 聊天机器人。近期 xAI 展示了 Grok-1.5 Vision 多模态模型,除文本外也可处理图像、文档和表格内容。xAI 的此次融资是以 180 亿美元(当前约 1305 亿元人民币)的估值进行的,参与投资者包括红杉资