应用

字节火山引擎总裁谭待:现在大模型价格回归正常水平,原来太贵了

字节跳动旗下火山引擎总裁谭待在上周接受澎湃新闻采访时,谈到了此前行业内发生的 AI 大模型 「价格战」。谭待认为,大模型原来的价格太贵了,现在是价格回归到应该回归的地方,这不是价格战。区别在于,像是字节火山引擎这样的公司有能力做到,而别人不一定有能力。针对目前 AI 面临巨大投入和商业回报不匹配的困扰,谭待认为,要先把现阶段的小回报慢慢积累,未来才能获得更好的回报,目前字节豆包大模型的技术创新还是为商业而服务,更偏向于走务实路线。对于 AI「超级应用」会何时出现的问题,谭待表示,只能交给时间回答,“就像移动互联网发

亚马逊被曝 10 月发布 Alexa AI 订阅版:月费 10 美元,梳理、汇总用户感兴趣的信息流

华盛顿邮报昨日(8 月 27 日)发布博文,报道称亚马逊内部正研发名为“Remarkable Alexa”的全新 AI 模型,加入到激烈的 AI 竞争中。消息称该 AI 模型内部代号为“Project Banyan”,亚马逊有望于 2024 年 10 月发布,主要分析人们如何使用现有的人工智能模型,并挑选出用户最需要的部分。AI在线援引消息源报道,该 AI 模型主要帮助客户策划、总结和探索头条、感兴趣的资讯等内容。消息源还表示亚马逊正在开发 Smart Briefing 功能,将基于用户的兴趣、爱好等因素,生成用户

智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行

智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:3D causal VAE:通过压缩视

新手必看!5 款 Flux 实用基础工作流(附资源包)

大家好,我是花生~ 上期为大家梳理了 Flux 生态的主流版本模型以及 Lora、Contronet 模型的用法,今天我们继续了解一些 Flux 基础工作流,如图生图、高清放大、局部重绘等,其中还包括上周新推出的 Flux IP-Adapter 的相关用法。 上期回顾:一、文生图工作流 之前为大家介绍过 2 款 Flux 基础文生图工作流,但其中原版工作流用到的模型节点较多,有的小伙伴在使用时一个不小心就会选错,导致工作流运行出现报错或者生成效果不佳,今天就再介绍一下其中比较重要的参数设置。① weight_dty

Anthropic 向所有 Claude 用户开放 Artifacts AI 功能

感谢AI 科技公司 Anthropic 今天(8 月 28 日)发布博文,宣布面向所有 Claude 用户开放 Artifacts 功能,用户现在可以在 iOS 和安卓版 Claude 应用中创建和浏览 Artifacts。Artifacts 简介Artifacts 于今年 6 月推出预览版,官方称用户目前已经创建了数千万个 Artifacts。 AI在线注:Artifacts 相当于创建了一个动态工作区,用户和 Claude 对话让其生成文档、代码、矢量图,甚至是简单的游戏过程中,Artifacts 会出现聊天界

「发疯」之余,谷歌前 CEO 演讲里还藏着这些 AI 真相

前阵子谷歌前 CEO 施密特在斯坦福大学的演讲分享彻底出圈了。其中内容牵涉到大量 硅谷科技企业的辛秘和 AI 相关的观点分享,相当多的言论看起来非常离谱且不加掩饰。很多文章将施密特的分享视作为「发疯」和「放飞自我」,但实际上,这些内容仅仅只是截取了施密特大量演讲内容当中很小的抓眼球的一部分。由于施密特本人的特殊身份和经历,所分享的内容也许并没有看起来那样仅有娱乐属性。国外还有不少媒体,会认为施密特的分享,直接大声说出了了这场 AI 革命中沉默的真相,把房间中的大象指给所有人看。 我在 Github 上找到了现场的录

最好用的智能座舱,最领先的AI智驾体验,小鹏MONA M03塑造越级体验

8月27日,“小鹏10年热爱之夜 小鹏MONA M03上市发布会”启幕,小鹏汽车展现了10年间产品线的快速完善以及技术的快速迭代,备受期待的小鹏MONA M03也正式上市发售。新车定位“智能纯电掀背轿跑”,共3款车型,包括小鹏MONA M03 515长续航版官方售价11.98万元、小鹏MONA M03 620超长续航版官方售价12.98万元、小鹏MONA M03 580超长续航Max版官方售价15.58万元。用户可通过小鹏汽车官方APP、官网、微信小程序以及全国销售网点进行车辆预订。即日起至2024年10月31日下

消息称 OpenAI 正开发“草莓”项目:前身为神秘 Q * 算法,最快今年秋季推出

当地时间 8 月 7 日,阿尔特曼放出了一张关于草莓的照片,暗示神秘“草莓(Strawberry)”项目,引起全网热议。The Information 报道称,随着 OpenAI 寻求筹集更多资金,其研究人员正试图推出一种新的 AI 产品,能够比现有产品更好地解决棘手的问题。据称,OpenAI 今年夏天已经向美国国家安全官员展示了这项技术,一位直接了解这些会议的人士表示,这些会议此前没有被报道过(AI在线注:最早是路透社上个月发布的爆料)。两名内部人士透露,团队目标是最早在今年秋天之前将代号为草莓(以前称为 Q*)

夸克发布全新PC端,系统级全场景AI能力升级AI电脑

将一台电脑升级为AI电脑需要几步?今后只需安装一个夸克就够了!8月27日,阿里智能信息事业群旗下夸克发布全新PC端,全面升级AI搜索、AI写作、AI PPT、AI文件总结等一系列功能。凭借“系统级全场景AI”能力,夸克为你升级AI电脑,一站式完成信息的检索、创作和总结。“始终面向用户、面向AI、面向未来,夸克在人工智能领域持续探索突破性的用户体验。”阿里智能信息事业群总裁吴嘉表示,全新的夸克开启了创造革新性搜索产品的无限可能,也为阿里巴巴人工智能战略布局增添了强有力的路径与动能。夸克PC端功能上新,为你升级一台AI

真香!智谱大模型,有了首个免费的API

大模型API,正式进入Flash时代。最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推出了 Mini 版,号称比当前最为先进的小模型能力更强,价格更低。如果你现在访问 ChatGPT,会发现原来的默认模型 GPT-3.5 已经消失,新的默认选项就是 GPT-4o mini。自 2022 年底一直沿用的 GPT-3.5 终于被取代了,这不禁让人

智谱 AI 宣布 GLM-4-Flash 大模型免费开放:支持中文、英语、日语、韩语、等 26 种语言

智谱 AI 今日宣布,GLM-4-Flash 大模型免费开放,通过智谱 AI 大模型开放平台调用。GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务,生成速度能达到 72.14 token/s,约等于 115 字符/s。GLM-4-Flash 具备多轮对话、网页浏览、Function Call(函数调用)和长文本推理(支持最大 128K 上下文)等功能,同时支持包括中文、英语、日语、韩语、德语在内的 26 种语言。官方表示,通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法

大模型时代,绿色计算这条路该怎么走?

人工智能时代,大模型的发展带来了智能算力需求的大爆发。据估算,自2012年以来,人工智能模型训练算力需求每3~4个月就翻一番,每年训练AI模型所需算力增长幅度高达10倍,将带来急剧上升的能耗和成本。如何构建绿色低碳、高经济性、高质量的大规模智算基础设施,实现智能算力时代的可持续发展,已成为行业内关注的热点话题。2024 Inclusion · 外滩大会期间,由蚂蚁集团、上海市通信学会算力浦江专委会主办,开放数据中心委员会、中关村标准化协会、中关村金融科技产业发展联盟 、北京前沿金融监管科技研究院支持的“绿色计算:大

李飞飞反对,马斯克、Hinton、Bengio支持,加州AI监管法案即将尘埃落定

历时半年的 SB 1047法案投票将于近日迎来大结局。「这是一个艰难的决定,会让一些人感到不安。但是,综合考虑所有因素,我认为加州或许应该通过 SB 1047 人工智能安全法案。二十多年来,我一直是人工智能监管的倡导者,正如我们对任何对公众存在潜在风险的产品 / 技术进行监管一样。」刚刚,马斯克发了这样一则推文。马斯克提到的 SB 1047 全称是「Safe and Secure Innovation for Frontier Artificial Intelligence Act(《前沿人工智能模型安全创新法案》

LLM取代的第一个编程语言竟是SQL?网友吵翻天

SQL 即将被 AI 取代,这种说法你同意吗?一年前,AI 大牛 Andrej Karpathy 曾预言,最热门的新编程语言是英语。一年后,人工智能及机器学习研究商 Abacus.AI 首席执行官 Bindu Reddy 表示:「LLM 用英语取代的第一个编程语言是 SQL,SQL 生成准确率超过 95%,超过了人类 SQL 程序员(准确率为 92%)的平均水平,大多数数据库产品已经提供了一个 chatbox 接口来查询数据」。Bindu Reddy 口中的 Chatbox 是一个开源的桌面端程序,Prompt 的

ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文作者来自复旦大学视觉与学习实验室和人工智能创新与产业研究院。其中第一作者高子怡为复旦大学研二硕士,主要研究方向为 AIGC 和 AI 安全。本文通讯作者是复旦大学的陈静静副教授。来自复

防止黑客重建人脸,浙大 & 阿里推出人脸隐私保护新方案 FaceObfuscator

对人脸数据安全的担忧,有新解了!浙江大学与阿里安全部联手,推出了新的人脸隐私保护方案 FaceObfuscator。不法分子即使从数据库中获取到人脸特征,也无法使用各类重构攻击还原人脸数据、窃取人脸隐私。新型重构攻击,威胁人脸隐私人脸识别是一项基于人脸特征信息进行身份识别的生物识别技术,广泛应用于金融、安防与民生。在使用人脸识别系统前,首先需要录入人脸信息,这些人脸信息会以人脸特征的形式被保存在服务商的人脸数据库中用于之后的实时人脸识别与身份认证。▲ 主流的人脸识别架构然而,网络和数据安全保障机制的欠缺容易导致人脸

独家 | 字节或成立大模型研究院,疯狂氪金 AI 人才

AI 科技评论独家获悉,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。 知情人士称,已有外部 AI 大牛加入大模型研究院。 但另一知情人士表示,字节有加强大模型相关研究的长期计划,但并未决定建立独立的机构。

日本金融巨头 SBI 与芯片创企 PFN 就新一代 AI 半导体组建联盟

日本 AI 芯片“独角兽”企业 Preferred Networks(以下简称 PFN)今日宣布同日本金融巨头 SBI Holdings 就 PFN 下代 AI 半导体的开发和产品化组建资本和商业联盟。根据 PFN 与 SBI Holdings 签署的协议,两家企业计划联合研发 PFN 下代 AI 半导体并携手推动芯片产品化,并在该芯片的封装测试流程展开合作。此外,SBI Holdings 母公司 SBI 集团计划在 2024 年 9 月底前通过 SBI Holdings 向 PFN 投资至多 100 亿日元(AI