马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

感谢马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI 表示:“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案
感谢马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。

xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。

xAI 表示:“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案例,,包括将白板上的流程图草图转化为 Python 代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为 CSV 文件格式等等。

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

xAI 还分享了 Grok-1.5V 的跑分情况,在 RealWorldQA 基准测试中,比 GPT-4V、Claude 3Sonnet、Claude 3 Opus 和 Gemini Pro 1.5 等主流竞争对手更为优异。

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

IT之家附上参考地址

Grok-1.5 Vision Preview

相关资讯

马斯克宣布 Grok 聊天机器人将在本周晚些时候向所有 X Premium 订阅用户开放

感谢埃隆・马斯克今日宣布,xAI 公司的 Grok 聊天机器人将在本周晚些时候向所有 X(原推特)Premium 订阅用户开放,而不仅限于 Premium 订阅用户使用。Grok 聊天机器人由 xAI 公司开发,去年 11 月起开始向 X Premium 订阅用户开放。IT之家此前报道,官方在本月早些时候宣布 3140 亿参数的 Grok-1 以 Apache 2.0 协议开源。随着 Grok 向全部 X Premium 用户开放,X Premium 用户将获得新的 Super Grok 模式。马斯克解释道,

消息称马斯克旗下人工智能公司 xAI 即将完成 60 亿美元最大融资

感谢综合外媒 The Information 和彭博社报道,马斯克旗下人工智能公司 xAI 将在未来两周完成 60 亿美元(IT之家备注:当前约 435 亿元人民币)的新一轮融资。这也是 AI 模型创企中最大的单轮融资之一。xAI 于 2023 年 7 月成立,去年 11 月推出首款产品 Grok 聊天机器人。近期 xAI 展示了 Grok-1.5 Vision 多模态模型,除文本外也可处理图像、文档和表格内容。xAI 的此次融资是以 180 亿美元(当前约 1305 亿元人民币)的估值进行的,参与投资者包括红杉资

马斯克承认自家 xAI 聊天机器人 Grok 不如 ChatGPT,但年底之前也许能赶上

感谢当地时间周四,马斯克在巴黎举行的 VivaTech 大会上发表视频讲话并接受远程采访,谈到了自家的人工智能初创公司 xAI。马斯克表示,xAI 是一家新公司,因此 Grok 仍有许多工作要做,才能拥有与谷歌 Deepmind 和 OpenAI 相抗衡的人工智能,也许在今年年底就能做到这一点。马斯克谈到 Grok 的未来发展时,强调了“求真”能力的重要性。他表示,Grok 将尽最大努力做到严谨,追求真相,做到最有趣,追求最大程度的真相也是 AI“最安全的做法”。马斯克说,另一方面 Grok 必须具有极强的好奇心。