理论
AI创业踩坑!YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。 如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。 ”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。
2/3/2025 1:18:01 PM
伊风
多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
本文一作 Maham Tanveer 是 Simon Fraser University 的在读博士生,主要研究方向为艺术视觉生成和创作,此前在 ICCV 发表过艺术字体的生成工作。 师从 Hao (Richard) Zhang, IEEE Fellow, Distinguished Professor, 并担任 SIGGRAPH 2025 Paper Chair. 本文尾作 Nanxuan (Cherry) Zhao 在 Adobe Research 担任 Research Scientist, 研究方向为多模态可控生成和编辑,有丰富的交叉方向研究经历(图形学 图像 人机交互),致力于开发可以让用户更高效进行设计创作的算法和工具。
2/3/2025 12:16:01 PM
机器之心
NeurIPS | 对比采样链:让扩散模型更快、更准、更清晰的秘密武器
论文 Contrastive Sampling Chains in Diffusion Models 的精炼解读。 一眼概览该论文提出了一种 对比采样链(Contrastive Sampling Chains, CSC) 方法,通过对比损失和得分匹配相结合,优化扩散模型(DMs)的采样过程,从而 减少离散化误差,提高生成图像的质量,同时提升采样速度。 核心问题扩散模型在使用数值求解方法进行采样时 不可避免地引入离散化误差,导致生成样本与真实数据分布之间存在偏差。
2/3/2025 10:04:47 AM
萍哥学AI
DeepSeek 实现任务调度分片算法 , 灵性十足,远超预期 !
这几天,中国人工智能公司 DeepSeek 火了,不仅在美区下载榜上超越了 ChatGPT ,还引发多个美国科技股的股价暴跌。 美国总统特朗普称 DeepSeek 的出现“给美国相关产业敲响了警钟”。 于是,怀着极强的好奇心,我尝试让 DeepSeek V3 模型帮我完成任务调度系统分片功能,流程见下文。
2/3/2025 10:00:00 AM
勇哥
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek 团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。 该研究突破性地采用强化学习(Reinforcement Learning)作为核心训练范式,在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。 技术架构深度解析模型体系:DeepSeek-R1系列包含两大核心成员:DeepSeek-R1-Zero参数规模:6710亿(MoE架构,每个token激活370亿参数)训练特点:完全基于强化学习的端到端训练核心优势:展现出自我验证、长链推理等涌现能力典型表现:AIME 2024基准测试71%准确率DeepSeek-R1参数规模:与Zero版保持相同体量训练创新:多阶段混合训练策略核心改进:监督微调冷启动 强化学习优化性能提升:AIME 2024准确率提升至79.8%训练方法论对比强化学习与主要依赖监督学习的传统模型不同,DeepSeek-R1广泛使用了RL。
2/3/2025 6:00:00 AM
dev
ChatGPT 被逼急了,连夜上线 o3-mini,并且还免费......
也许是迫于 DeepSeek 的压力,open ai 的负责人 萨姆·奥尔特曼,连发多个 Twitter(现在是 X) 推出了新的模型 o3-mini,并且包含三个版本:low、medium 和 high,分别针对不同的性能和资源需求优化。 图片现在,只要大家打开 chatgpt 的官网,就可以看到大大的 o3-mini 的宣传海报:图片图片虽然 o3-mini 的具体性能还没有经过广泛的实战验证,但是一些第三方的初步评测已经流出。 尤其是发布 几个小时后,加州大学的一位 AI 博士就对包括 o3-mini 在内的多款大语言模型进行了测试,评测指标包括 Accuracy(准确率) 和 Calibration Error(校准误差)图片根据评测结果可以看到,在他的评测中 o3-mini (high) 模型的 准确率为 13.0% 为全场最高。
2/3/2025 12:15:00 AM
程序员Sunday
DeepSeek 火爆了,主打高性能低价格!
大家好,我是君哥。 春节这几天,DeepSeek 可以说是火爆了,铺天盖地都是 DeepSeek 的报道。 今天,我们一起学习一下 DeepSeek。
2/3/2025 12:00:15 AM
朱晋君
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
顶级“礼遇”。 一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了。 据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。
2/3/2025 12:00:10 AM
全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/2/2025 11:41:00 PM
机器之心
万字长文解读Scaling Law的一切,洞见LLM的未来
Scaling Law 撞墙了吗? 这算得上是近段时间 AI 领域最热门的话题之一。 近日,资深机器学习研究科学家 Cameron R.
2/1/2025 7:58:00 PM
机器之心
赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!
编辑丨&人工神经网络(ANN)是大多数深度学习(DL)算法的核心,这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。 然而,与能够高效解决类似问题的生物大脑不同,DL 算法需要大量可训练参数,这使得它们能耗高且容易过拟合。 来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构,它结合了生物树突的结构化连接和受限采样特性,抵消了这些限制。
2/1/2025 3:04:00 PM
ScienceAI
Nature发布:2025年值得关注的七项技术
编辑 | 20492025 年,全球科技发展正以惊人的速度重塑人类社会的未来。 在气候危机、疾病威胁与资源短缺的多重压力下,技术创新聚焦于两大核心方向:可持续性与人工智能(AI)的深度结合。 《Nature》盘点了今年将密切关注的七项技术,从实验室的自动化革命到城市的生态改造,从精准医疗到环境修复,七项技术不仅加速科学发现,更试图为人类提供应对复杂挑战的规模化方案。
2/1/2025 3:03:00 PM
ScienceAI
David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗
编辑丨&蛇中毒是一种严重的个人健康威胁,每年导致约 10 万人死亡和 30 万人永久残疾,尤其是在医疗资源匮乏的地区。 目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体,存在成本高、副作用大、对某些毒素效果有限等问题。 今年诺贝尔化学奖得主 David Baker 团队的一项研究揭示了蛇咬伤治疗可能改变游戏规则。
1/30/2025 12:03:00 PM
ScienceAI
CityDreamer4D: 下一个世界模型,何必是视频生成模型?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
1/28/2025 1:19:00 PM
机器之心
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
1/28/2025 1:08:00 PM
机器之心
验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法
图 1:研究概念图。 编辑 | ScienceAI随着全球对可再生能源需求的日益增长,电池作为储能系统关键技术的地位愈发凸显。 然而,电池研发过程中面临着从材料原型到商业产品转化的重重挑战,电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。
1/27/2025 7:13:00 PM
ScienceAI
闲来无事,我测了测国产大模型的RAG能力 新智元 新智元 2025年01月27日 12:25 北京
最近,AI界被推理模型刷屏了。 国内各家的推理模型,在新年到来之际不断刷新我们的认知。 不过,当我们在实际应用中考量大模型,衡量好不好用的标准,就绝不仅仅局限于其性能和规模了。
1/27/2025 12:41:00 PM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉