应用
最强卷王3个月进化9次!可灵AI上新1.5模型,国外网友:太疯狂
传说中的 Sora 公测还遥遥无期,「卷王」可灵又又又上新了。要知道,自今年 6 月发布以来,仅三个月,可灵 AI 就迭代了 9 次。这次它还直接把基座模型升级了,推出可灵 1.5 模型。那么,这个新模型到底强在哪儿?举个例子,我们输入同样的 Prompt:一位女生看到一封信后悲伤起来,不停地哭泣。1.0 模型的效果是这样的:1.5 模型的效果则是这样:(视频来源:X 博主 Pierrick Chevallier)一言以蔽之,可灵 1.5 模型不仅显著提升画质,直出 1080p 视频,还让画面主体的动幅更大、质量更
9/21/2024 8:26:00 PM
机器之心
部分科技巨头请求欧盟对 AI“从宽”监管,避免数十亿美元罚款风险
据路透社 20 日报道,一些全球科技巨头正在尽最后的努力,试图说服欧盟在监管 AI 时采取宽松的方式,以避免面临数十亿美元的罚款风险。在经过各政治团体几个月的激烈谈判后,欧盟今年 5 月通过了《人工智能法》(AI Act),这是全球首个全面规范该技术的法律。然而在相关操作规程最终敲定之前,仍然不清楚如何严格执行针对通用用途人工智能(GPAI)系统(如 OpenAI 的 ChatGPT)的规定,以及公司可能面临多少版权诉讼和数十亿美元的罚款。欧盟已邀请公司、学者及其他相关方帮助起草操作规程,据不具名知情人士透露,欧盟
9/21/2024 8:16:40 PM
清源
最癫 AI 社交 App“SocialAI”上线 3 天爆火,注册即送百万“粉丝”
最癫 AI 社交 App,刚上架苹果商店 3 天就火了:根据网友分享的试玩体验,它能让你成为世界的主角,注册就送百万粉丝,但全都不是真人,随便发什么帖都有大批机器人回复点赞。虽然都是假的,但居然很多人玩过之后表示,“很上头”。作者公布后台注册人数统计,上升曲线陡峭,或考虑加上邀请限制。比如一位网友发的是“我想辞职去开一家羊驼农场”。评论区有提供鼓励的如“追梦去吧,羊驼就是可持续农业的未来”,也会有喷子来质疑你“你考虑过经济可行性吗?”。他表示玩起来让人渴望那种瞬间获得关注和反馈的感觉,总价下来体验就像:口袋里装了一
9/21/2024 5:43:15 PM
清源
o1 核心作者 MIT 演讲:激励 AI 自我学习,比试图教会 AI 每一项任务更重要
“o1 发布后,一个新的范式产生了”。其中关键,OpenAI 研究科学家、o1 核心贡献者 Hyung Won Chung,刚刚就此分享了他在 MIT 的一次演讲。演讲主题为“Don’t teach. Incentivize(不要教,要激励),核心观点是:激励 AI 自我学习比试图教会 AI 每一项具体任务更重要思维链作者 Jason Wei 迅速赶来打 call:Hyung Won 识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022 年底,他意识到了强化学习的力量,并从那时起就一直在宣扬它。在演
9/21/2024 2:46:27 PM
清源
OpenAI 朝 AI 第 3 阶段迈进,正招募人才组建“多智能体”团队
OpenAI 在发布 o1 AI 模型之后,下一步会怎么走?该公司研究员诺姆・布朗(Noam Brown)在 X 平台给出了答案,组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,解决人类水平问题的人工智能第三级:智能体,能够代表用户采取行动的人工智能第四级:创新
9/21/2024 12:10:50 PM
故渊
英伟达 NVLM 1.0 引领多模态 AI 变革:媲美 GPT-4o,不牺牲性能平衡文本和图像处理难题
科技媒体 marktechpost 昨日(9 月 20 日)发布博文,报道了英伟达(Nvidia)最新发布的论文,介绍了多模态大语言模型系列 NVLM 1.0。多模态大型语言模型(MLLM)多模态大型语言模型(MLLM)所创建的 AI 系统,能够无缝解读文本和视觉数据等,弥合自然语言理解和视觉理解之间的差距,让机器能够连贯地处理从文本文档到图像等各种形式的输入。多模态大型语言模型在图像识别、自然语言处理和计算机视觉等领域拥有广阔应用前景,改进人工智能整合和处理不同数据源的方式,帮助 AI 朝着更复杂的应用方向发展。
9/21/2024 11:53:13 AM
故渊
OpenAI 笑傲 AI 江湖:新 50-70 亿美元融资将完成,估值有望破 1500 亿美元
科技媒体 The Decoder 昨日(9 月 20 日)发布博文,报道称 OpenAI 公司即将完成一轮价值 50 亿至 70 亿美元(当前约 352.76 亿至 493.86 亿元人民币)的大规模融资,公司估值有望达到 1500 亿美元(当前约 1.06 万亿元人民币)。消息称在本次融资中,OpenAI 设定的最低投资额为 2.5 亿美元(当前约 17.64 亿元人民币)。本次融资由 Thrive Capital 领投,承诺投资 10 亿美元(当前约 70.55 亿元人民币),AI在线附上其他参投的企业如下:微
9/21/2024 11:26:55 AM
故渊
突发!高通准备收购英特尔
我们可能会见证一场世纪收购。Arm 与 X86 的战争会以这种方式终结?本周五,据《华尔街日报》援引知情人士的话称,高通已对芯片巨头英特尔提出了收购要约。此次收购若能成功,以手机芯片闻名的高通将创造历史,接管这家世界闻名的硅谷芯片公司。在 PC 的发展历史上,英特尔的大名无处不在,英特尔成立于 1968 年,它构建了大部分现代个人电脑的核心,但最近也一直在努力转向支持人工智能的芯片。 高通目前市值约 1882 亿美元,英特尔市值约为 934 亿美
9/21/2024 10:43:00 AM
机器之心
有手就能学!如何用字节跳动 Coze 搭建小红书二创工作流?
小结: 懒人救星!Coze工作流,让内容创作更简单,躺着也能高产!
目录:可根据自己感兴趣的内容进行查看或实操
使用小攻略:不熟悉 Coze:建议从头开始看;
熟悉 Coze:可直接跳过「一」,去看实操部分「二」;一、Coze 平台
1. Coze 是什么官方介绍:Coze 是字节跳动推出的新一代一站式 AI Bot 开发平台。
无论你是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。
你可以将搭建的 Bot 发布到各类社交平台和通讯软件上,
9/21/2024 8:43:42 AM
省略号
微软启动第二波 Copilot AI 更新:全新 Pages、Excel 支持 Python、上线 Agents 等
感谢微软公司于 9 月 18 日发布新闻稿,宣布启动 Microsoft 365 Copilot 第二波更新,引入了全新的 Pages,为 Excel 支持 Python 语言,以及上线 Copilot Agents 等。Copilot PagesCopilot Pages 能够将暂时生成的 AI 内容记录下来,随时进行编辑、补充或与他人共用。团队成员与 Copilot 可在同一个页面上展开协作,即时查看每个人的工作进度,如同将它视为团队中的一员般进行对话,向 Copilot 提出要求,从资料、档案和网络中添加新
9/21/2024 8:25:31 AM
故渊
古农文垂直领域大语言模型“齐民”发布,基于我国大量农业古籍文本训练
综合新华社、中国网消息,由农业农村部农业大数据重点实验室、中国农业科学院农业信息研究所联合湖北省图书馆、华中农业大学图书馆、郑州师范学院传播学院、中华书局古联(北京)数字传媒科技有限公司等单位开发的古农文垂直领域大语言模型“齐民”今天在北京发布。AI在线从报道中获悉,中国具备历史悠久的农业文明和耕读文化,孕育了众多的农学家、产生了大量的古农书,古农书是中国传统农业精髓的重要载体,也是我国文化遗产的重要组成部分。“齐民”古农文大语言模型基于我国古代大量农业古籍文本训练,从农业古籍中汲取智慧,深入挖掘古代农业技术、农耕
9/20/2024 9:57:57 PM
清源
摩尔线程开源 OpenCV-MUSA:支持绝大部分 cv::cuda 命名空间下数据结构及 API
感谢摩尔线程宣布其自研统一系统架构 MUSA 已完成与开源计算机视觉库 OpenCV 的适配,并正式发布 OpenCV-MUSA 开源项目。OpenCV 作为计算机视觉领域最重要的开源库之一,为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。在现有 OpenCV 代码的基础上,摩尔线程新增了 MUSA 设备后端,并为多个算法模块提供了 MUSA 加速支持,同时对编译脚本也进行了适配。目前 OpenCV-MUS
9/20/2024 5:28:01 PM
沛霖(实习)
武汉大学首个人形机器人“天问”亮相:身长 1.7m、体重 65kg、36 个自由度
武汉大学首个人形机器人“天问”亮相。据武汉大学工业科学研究院副教授李淼介绍,“天问”一名的取名灵感来源于《楚辞》中屈原的千古名篇《天问》。▲ 图源武汉大学,下同AI在线获悉,今年 3 月 18 日,人形机器人“天问”项目正式立项;6 月完成样机组装、启动联调联试;如今熟练掌握走、跑、跳等基本技能。经过数月的不断调试和修复,团队从整体结构、电路、算法等层面确定了下肢用强化 sim2real 和上肢用模仿扩散模型的技术路线,并初步实现了机器人稳定行走的功能。“天问”机器人身长 1.7m、体重 65kg,拥有一双引人瞩目
9/20/2024 2:51:06 PM
沛霖(实习)
真·AI程序员来了,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在成为低门槛的设计工具。昨天,阿里云完成了「可能是历史上最大规模的模型开源发布」,开源了通义千问 Qwen2.5 系列模型,又在云栖大会的年度重磅发布中
9/20/2024 1:41:00 PM
机器之心
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强,尤其是以语言为中心的任务。近日,一篇来自德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的论文引发了热议,其模仿莎士比亚《哈姆雷特》的台词提出了一个对 AI 研究者和实践者来说至关重要的问题:To CoT or not to
9/20/2024 1:35:00 PM
机器之心
别Cursor了,集成o1的GitHub Copilot让网友直呼要回归
waitlist 挤爆了。草莓大模型又来了。昨天,GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文,一时间勾起了很多人的好奇心。很多人猜测 GitHub Copilot 要集成 OpenAI 最新的 o1 系列模型了,毕竟再不升级就可能要被最近势头很猛的 Cursor 抢走更多用户了。果不其然,今天一大早,GitHub 便官宣了在 VSCode 中为 GitHub Copilot Chat 开放 o1-preview 和 o1-mini 的早期访问权。同时,用户也可以在 Github
9/20/2024 1:31:00 PM
机器之心
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜:数学能力碾压 Claude 和谷歌 Gemini 模型,o1-mini 并列第一
o1 模型发布 1 周,lmsys 的 6k 投票就将 o1-preview 送上了排行榜榜首。同时,为了满足大家对模型「IOI 金牌水平」的好奇心,OpenAI 放出了 o1 测评时提交的所有代码。万众瞩目的最新模型 OpenAI o1,终于迎来了 lmsys 竞技场的测评结果。不出意外,o1-preview 在各种领域绝对登顶,超过了最新版的 GPT-4o,在数学、困难提示和编码领域表现出色;而 o1-mini 虽然名字中自带「mini」,但也和最新版的 GPT-4o 并列综合排名第二,困难提示、编码、数学
9/20/2024 1:29:05 PM
问舟
华为云AI原生基础设施CloudMatrix亮相全联接大会
今天,在华为全联接大会 2024 上,华为云发布了 AI 原生云基础设施架构 CloudMatrix,以满足 AI 时代企业对于算力的大规模、高效稳定、弹性灵活的需求。华为云 AI 原生云基础设施架构 CloudMatrix 正式发布如今,AI 算力需求高速增长,正在超越对通用算力的需求。构建弹性、高效的多元算力基础设施是 AI 发展的关键。为了进一步提升 AI 原生基础设施的效能,华为云推出 AI 原生云基础设施 CloudMatrix,将 CPU、NPU、DPU、存储和内存等资源全部互联和池化,构建「一切可池化
9/20/2024 12:13:00 PM
新闻助手
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
模型
谷歌
大模型
Midjourney
智能
开源
用户
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
生成式
代码
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
GPU
开发者
AI视频
场景
华为
预测
人形机器人
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
具身智能
驾驶
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
干货合集
应用
训练
大型语言模型
科技
亚马逊
特斯拉
2024
AGI