资讯列表
TrendForce:DeepSeek 的低成本 AI 模型将催生光通信需求
TrendForce集邦咨询近日发布的研报指出,DeepSeek模型虽降低AI训练成本,但AI模型的低成本化有望扩大应用场景,进而增加全球数据中心建置量。
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线
跟大模型说:要多想。 今年 1 月,DeepSeek R1 引爆了全球科技界,它创新的方法,大幅简化的算力需求撼动了英伟达万亿市值,更引发了全行业的反思。 在通往 AGI(通用人工智能)的路上,我们现在不必一味扩大算力规模,更高效的新方法带来了更多的创新可能。
清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!
编辑 | 2049近年来,人工智能技术在各个领域的广泛应用对计算效率提出了更高要求。 特别是在边缘计算场景中,如何降低深度学习模型的计算成本和功耗成为关键挑战。 来自清华大学的研究团队提出了一种创新的光谱卷积神经网络(Spectral Convolutional Neural Network,SCNN)芯片架构,通过将光学计算与电子计算相结合,实现了无相干自然光的片上边缘计算。
DeepSeek 进入“国家队”,超算互联网上线 R1 / V3 / Coder 等系列模型
国家超算互联网平台已正式上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并将于近期陆续更新32B、70B等版本。
光中介层可能在 2025 年开始加速 AI
编辑丨toileter光纤电缆正在逐渐靠近高性能计算机中的处理器,用玻璃取代铜连接。 科技公司希望通过将光学连接从服务器外部移动到主板上,然后让它们与处理器并排放置,从而加速 AI 并降低其能源成本。 现在,科技公司准备在寻求成倍增加处理器潜力的道路上走得更远——通过滑入处理器下面的连接。
70年AI研究得出了《苦涩的教训》:为什么说AI创业也在重复其中的错误?
人人都在做垂直 AI 产品,为什么要反其道而行? Scaling Laws 是否失灵,这个话题从 2024 年年尾一直讨论至今,也没有定论。 Ilya Sutskever 在 NeurIPS 会上直言:大模型预训练这条路可能已经走到头了。
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
OpenAI再遭当头一棒:人形机器人合作伙伴Figure“单飞”
2月4日,机器人公司Figure宣布终止与OpenAI的合作,这一决定引发了业界的广泛关注。 Figure的创始人Brett Adcock表示,公司已经在全自主研发的端到端机器人AI方面取得了重大突破,并计划在未来30天内向外界展示“人形机器人上从未见过的东西”。 R-C.jpg合作背景与终止原因Figure与OpenAI的合作始于2024年2月,当时Figure完成了6.75亿美元的B轮融资,投资方包括微软、英特尔、OpenAIStartup Fund、Amazon Industrial Innovation .
华为小艺助手接入 DeepSeek,升级纯血鸿蒙 HarmonyOS NEXT 即可体验
据多位IT之家小伙伴反馈,华为纯血鸿蒙 HarmonyOS NEXT 的小艺助手 App 已接入 DeepSeek,智能体广场已上线 DeepSeek-R1 的 Beta 版。
韩国政府称 DeepSeek 带来冲击:将成立“国家 AI 委员会”,目标成为世界三大 AI 领先国家之一
就在韩国政府公告前一天,OpenAI 首席执行官 Sam Altman 访问了韩国首尔,会见了三星电子、SK 以及互联网公司 Kakao 的高管。
加州拟出新规:AI 公司必须定期提醒儿童聊天机器人不是人类
美国加利福尼亚州提出了一项新法案(SB 243),该法案要求人工智能(AI)公司定期提醒儿童,聊天机器人是 AI 而非人类。这项法案由加利福尼亚州参议员史蒂夫・帕迪拉提出,旨在保护儿童免受 AI“容易使人上瘾、造成孤立和产生影响”等方面的危害。
Diffusion Mamba:用线性计算打造高效高分辨率图像生成新范式
一眼概览Diffusion Mamba (DiM) 是一种结合状态空间模型(SSM)和扩散模型的新架构,旨在实现高效的高分辨率图像生成。 相比于基于 Transformer 的扩散模型,DiM 具有更优的计算效率,特别是在超高分辨率图像(1024×1024 及以上)生成任务中表现突出。 核心问题目前的扩散模型主要依赖U-Net或Vision Transformer(ViT)作为骨干架构。
谷歌 CEO 皮查伊盛赞 DeepSeek:非常出色,AI 成本下降有利于整个行业发展
皮查伊指出,随着 AI 推理成本不断降低,AI的应用场景将进一步拓展,这为谷歌创造了新的增长机会。而谷歌的 Gemini 2.0 Flash 和 2.0 Flash Thinking 模型在效率上可与 DeepSeek R1 相抗衡。
Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
Chirpy3D框架可以将细粒度的2D图像理解提升至3D生成的全新境界。 当前的3D生成方法往往只关注于重构简单的对象,缺乏细致的特征和创造性。 Chirpy3D通过结合多视角扩散模型和连续的部件潜在空间,能够生成全新且合理的3D鸟类模型。
郭明錤:DeepSeek 爆红将加速端侧 AI 发展
DeepSeek 的流行直接推动了英伟达 H100 训练需求的增长,表明优化的训练方法(可有效降低成本)能够刺激市场,同时也再次证明了 CUDA 生态的竞争力(用户为何选择 H100)。
突发!人形机器人Figure宣布与OpenAI终止合作
今天凌晨 3 点半,AI 机器人公司 Figure 创始人兼 CEO Brett Adcock 的一条推文让整个 AI 社区都大呼意外。 他宣布终止与 OpenAI 的合作协议,并表示 Figure 在完全自主研发的端到端机器人 AI 方面取得了重大突破,还承诺「将在未来 30 天内展示一些人们从未在人形机器人上见过的东西」。 实际上,这两家备受关注的公司开启合作还不到一年时间。
快手发布DragAnything,拖动锚点精准控制视频物体和镜头运动,视频运动控制技术革命性更新
快手联合浙江大学、新加坡国立大学发布了DragAnything ,利用实体表示实现对任何物体的运动控制。 该技术可以精确控制物体的运动,包括前景、背景和相机等不同元素。 该项目提供了对实体级别运动控制的新见解,通过实体表示揭示了像素级运动和实体级运动之间的差异。