应用

百度沈抖:AI 大模型应用进入爆发期,底层算力会持续吃紧

2024 中国联通合作伙伴大会今日举行,华为董事长梁华、百度集团执行副总裁沈抖、中兴通讯总裁徐子阳等多位企业高管出席并发表了主题演讲。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,当下,各行各业都在加速拥抱大模型。过去一年在和众多企业的合作中看到了两个明显的趋势:一是底层算力会持续吃紧,一云多芯会成为中国企业的必然选择。二是大模型的应用已经进入爆发期,需要有高效的工具链去解决企业复杂多样的业务场景。同时,他表示大模型落地呈现出行业性差异,基础大模型行业增强成为必备能力。李彦宏在 2024 世界人工智能大会期间时

GPT-4o Mini深夜突发:即刻免费上线,API降价60%

大模型向小了。还没「休息」几天,AI 大模型再次卷起来了。刚刚,OpenAI 突然宣布了「Mini」版本的 GPT-4o 模型。该公司表示,新的轻量级版本旨在让更多公司和项目能够获得最先进的技术。这款名为 GPT-4o mini 的新模型立即上线,它在 MMLU 上的得分为 82%,目前在 LMSYS 排行榜的聊天方面分数优于 GPT-4。除了立即在 ChatGPT 免费版、付费版上可用以外,GPT-4o mini 的商用价格是每百万输入 token 15 美分,每百万输出 token 60 美分 —— 比之前的

完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗

「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」什么,这些同事竟然都是大模型驱动的 “数字人”?只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。就像这样:像这样:这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到

提示词用上“过去式”,秒破 GPT-4o 等六大模型安全限制:中文语境也好使

只要在提示词中把时间设定成过去,就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效,原本只有 1% 的攻击成功率直接飙到 88%,几乎是“有求必应”。有网友看了后直言,这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文,揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱,不用像“奶奶漏洞”那样专门构建特殊情境,更不必说专业对抗性攻击里那些意义不明的特殊符号了。只要把请求中的时间改成过去,就能让 GPT-4o 把燃烧弹和毒品的配方和盘托出。而且量子位实测发现,把提示词改成中文,

GPT-4o mini一手测评:懂得不多,但答得极快

GPT-4o mini主打一个字「快」。昨晚,OpenAI 突然上线新模型 GPT-4o mini, 声称要全面取代 GPT-3.5 Turbo。在性能方面,GPT-4o mini 在 MMLU 上的得分为 82%,在 LMSYS 排行榜的聊天方面分数优于 GPT-4。在价格方面,GPT-4o mini 比之前的 SOTA 模型便宜一个数量级,商用价格是每百万输入 token 15 美分,每百万输出 token 60 美分,比 GPT-3.5 Turbo 便宜 60% 以上。OpenAI 表示,ChatGPT 的免

小模型卷起来了:Mistral联合英伟达开源12B小模型,128k上下文

小模型,正在成为 AI 巨头的新战场。今天凌晨,OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-3.5,作为免费模型在 ChatGPT 上提供。其 API 价格也非常美丽,每百万输入 token 仅为 15 美分,每百万输出 token 60 美分, 比之前的 SOTA 模型便宜一个数量级,比 OpenAI 此前最便宜的 GPT-3.5 Turbo 还要便宜 60% 以上。OpenAI CEO 山姆・奥特曼对此的形容是:通往智能的成本已经「too che

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文的主要作者为黄毅翀。黄毅翀是哈尔滨工业大学社会计算与信息检索研究中心博士生,鹏城实验室实习生,师从秦兵教授和冯骁骋教授。研究方向包括大语言模型集成学习、多语言大模型,相关论文发表于自然

断网也能用!贾扬清团队推出端侧模型 Chrome 插件,arXiv/B站 / 吃瓜一件搞定

免费不限次 / 免登录,贾扬清团队的 Elmo 插件再次升级 —— 第一个支持端侧模型的 Chrome 插件。这下,Elmo 插件“断网”也能用了:据了解,Elmo 插件调用了 Chrome 本地模型 Gemini nano,大小为 12MB。这一更新(v0.3.2)目前处于 Early Preview(早期预览)阶段,Chrome 商店正在审核中。Elmo 插件发布于今年 4 月,在经过 22 个版本的迭代后,目前在 Chrome 商店已积累 3W 粉丝。发布至今,不仅收获了网友一致好评,还引来了一众大佬打

商汤绝影行业首发原生多模态大模型车端部署:80 亿参数、每秒 40 Tokens

商汤科技联合创始人、首席科学家王晓刚 17 日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧 8B 模型首包延迟在 300 毫秒以内,推理速度 40 Tokens / 秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯片的部署平台。商汤绝影称 HyperPPL 针对车载多人场景进行优化,使得车内多人并发情况下,车端多模态大模型的模型推理效率相比单人没有明显降低。据AI在线此前报道,商汤绝影此前表示,

Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT-4o Mini;通义千问大模型技术骨干周畅将离职创业丨AI情报局

今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一,双方合作推出了名为 Anthology Fund 的 1 亿美元人工智能初创基金,旨在投资于人工智能领域的种子前、种子和 A 轮公司。 该基金将为初创企业提供从 10 万美元起步的投资,并提供 25 万美元的信用额度以使用 Anthropic 的模型。 Menlo 将利用其自家的机器学习工具来评估和排名申请,并承诺对表现出色的公司进行后续融资的支持。

阿尔特曼深夜发动价格战:OpenAI GPT-4o mini 全新小模型登场,GPT-3.5 退役

感谢AI在线网友 刺客 的线索投递!OpenAI,也开始进军小模型了。就在今天深夜,GPT-3.5 退场,全新发布的 GPT-4o mini,更小、性能更强,更重要的是 —— 更便宜!▲ GPT-3.5,再见!每百万个输入 token 15 美分,每百万个输出 token 60 美分,MMLU 得分 82%,性能超快。CEO Sam Altman 感慨道:通往智能的成本,竟是如此低廉。是的,如火如荼的大模型价格战,OpenAI 也入场了。Altman 回顾说:就在 2022 年,世界上最好的模型是还是 text-d

各大高校特邀讲师!优设专访AI人气创作者焦渝轩

设计师Stephen在展陈空间和建筑领域不断探索,致力于将AIGC带来的创新性与传统的设计流程进行融合,探索如何能让AI真正服务设计行业。目前已制作发布SD模型百余件。他近期制作的作品《莲》荣获2024阿里D20未来青年AI设计入围奖、2024ROCA平面与空间设计奖铜奖、第五届紫金奖设计展入围奖等。

构筑 AI 安全防线,谷歌、微软、英伟达等 14 家公司组建安全 AI 联盟

感谢昨日举办的阿斯彭安全论坛(Aspen Security Forum)会议中,谷歌、微软、OpenAI、亚马逊、英伟达、英特尔等 14 家 AI 领域的大公司宣布联合组建安全人工智能联盟(Coalition for Secure AI,CoSAI)。CoSAI 由 OASIS 全球标准机构主办,是一项开源计划,旨在为所有 AI 从业人员和开发人员提供创建设计安全人工智能系统所需的指导和工具。CoSAI 将建立一个合作生态系统,共享开源方法、标准化框架和工具等等。CoSAI 的创始赞助商包括谷歌、IBM、英特尔、微

英伟达联合发布 Mistral-NeMo AI 模型:120 亿参数、上下文窗口 12.8 万个 token,要变革商业 AI 应用

英伟达联合法国初创公司 Mistral AI,今天发布了全新的 Mistral-NeMo AI 大语言模型,拥有 120 亿个参数,上下文窗口(AI 模型一次能够处理的最大 Token 数量)为 12.8 万个 token。VentureBeat 与 Midjourney 合作制作Mistral-NeMo AI 大模型主要面向企业环境,让企业不需要使用大量云资源的情况下,实施人工智能解决方案。由于 Mistral NeMo 依赖于标准架构,因此企业在使用过程中可直接替换任何使用 Mistral 7B 的系统。英伟达

AIGC案例实战!百度APP 如何用 AI 完成242个彩蛋设计?

导语 得益于 AI 技术的有力支撑,百度 APP 塑造出独特的互动彩蛋体验模式,大幅提升了用户参与度与社区凝聚力。早在 2023 年端午节时,我们对彩蛋初次探索即获好评,故将其作为长效运营手段,决定全年运营,筹划借助 AI 提效互动彩蛋生产,为互动生态注入全新活力与创造力。接下来,就让我们一同探讨 AI 与彩蛋的双向奔赴,实现百度 APP 互动规模化氛围营造。一、规模化难 在视频、图文等多场景中,我们建立了视频弹幕、评论、点赞三大互动阵地,不断拓展互动的边界,为用户和社区缔造出更为丰富且多元的价值。然而,传统的彩蛋

OpenAI 推出 AI 模型 GPT-4o mini,号称功能最强、成本效益最高的小模型

感谢据 CNBC 报道,OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,这是 OpenAI 为扩大其聊天机器人的使用范围所做的最新努力。OpenAI 方面称,此次新发布的产品将是“目前功能最强大、成本效益最高的小型模型”,并计划晚些时候将图像、视频和音频能力整合到该模型中。GPT-4o mini 同样也是 OpenAI 推动“多模态”(multimodality)技术发展的一部分,“多模态”是指在一个工具中提供多种类型的人工智能生成媒体,如文本、图像、音频和视频。据悉,GPT-4o mini

日本新闻协会:谷歌、微软等平台的“AI 搜索”功能可能侵犯著作权

据共同社报道,日本新闻协会 17 日发表声明称,美国 IT 巨头谷歌、微软等公司提供的 AI 搜索引擎很可能构成对著作权的侵犯。该协会指出,AI 搜索等服务经常擅自利用新闻报道作为信息源、生成类似新闻报道的回答,并要求美国 IT 巨头获得新闻媒体的使用许可。图源 PexelsAI在线从声明中获悉,日本新闻协会将该服务描述为“将网络搜索引擎与生成式人工智能(AI)相结合”,即“搜索联动型生成式 AI 服务”。部分案例显示,搜索联动型 AI 对新闻报道进行了不恰当的转用和加工,生成了存在错误内容的回答。该声明强调,(服

“与 AI 约会”缓解孤独感:日本 AI 交友应用 Loverse 上线一年多获得 5000 余用户

据彭博社周一报道,日本一家初创公司 Samansa 开发的 AI 交友应用 Loverse 拥有超过 5000 名用户,这款一岁多的 App 最明显的特征,就是用户只被允许与生成式 AI 互动。报道提到了一位名为 Shimoda 的 52 岁职工的经历。他在两年之前离婚,并坦言道:“我回到一个空荡荡的家。我真的希望再次结婚。”在两个月的时间内,他与五六位潜在伴侣互换了个人信息,但他最后却选择了上述 App 中的名为 Miku 的“虚拟女友”。这名职工表示,约会往往需要时间和精力,而与 Miku 的交流需在等待把饭煮