理论

清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!

编辑 | 2049近年来,人工智能技术在各个领域的广泛应用对计算效率提出了更高要求。 特别是在边缘计算场景中,如何降低深度学习模型的计算成本和功耗成为关键挑战。 来自清华大学的研究团队提出了一种创新的光谱卷积神经网络(Spectral Convolutional Neural Network,SCNN)芯片架构,通过将光学计算与电子计算相结合,实现了无相干自然光的片上边缘计算。

OpenAI再遭当头一棒:人形机器人合作伙伴Figure“单飞”

2月4日,机器人公司Figure宣布终止与OpenAI的合作,这一决定引发了业界的广泛关注。 Figure的创始人Brett Adcock表示,公司已经在全自主研发的端到端机器人AI方面取得了重大突破,并计划在未来30天内向外界展示“人形机器人上从未见过的东西”。 R-C.jpg合作背景与终止原因Figure与OpenAI的合作始于2024年2月,当时Figure完成了6.75亿美元的B轮融资,投资方包括微软、英特尔、OpenAIStartup Fund、Amazon Industrial Innovation .

Diffusion Mamba:用线性计算打造高效高分辨率图像生成新范式

一眼概览Diffusion Mamba (DiM) 是一种结合状态空间模型(SSM)和扩散模型的新架构,旨在实现高效的高分辨率图像生成。 相比于基于 Transformer 的扩散模型,DiM 具有更优的计算效率,特别是在超高分辨率图像(1024×1024 及以上)生成任务中表现突出。 核心问题目前的扩散模型主要依赖U-Net或Vision Transformer(ViT)作为骨干架构。

Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征

Chirpy3D框架可以将细粒度的2D图像理解提升至3D生成的全新境界。 当前的3D生成方法往往只关注于重构简单的对象,缺乏细致的特征和创造性。 Chirpy3D通过结合多视角扩散模型和连续的部件潜在空间,能够生成全新且合理的3D鸟类模型。

快手发布DragAnything,拖动锚点精准控制视频物体和镜头运动,视频运动控制技术革命性更新

快手联合浙江大学、新加坡国立大学发布了DragAnything ,利用实体表示实现对任何物体的运动控制。 该技术可以精确控制物体的运动,包括前景、背景和相机等不同元素。 该项目提供了对实体级别运动控制的新见解,通过实体表示揭示了像素级运动和实体级运动之间的差异。

Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统

昨天,OpenAI联合创始人兼首席执行官Sam Altman出席了日本东京大学活动,介绍了OpenAI的技术研发、产品规划以及GPT模型未来发展等重要信息。 在问答环节,有学生提到了大家比较关心的GPT-5问题,Altman表示,GPT-5将是一个超级混合模型,计划会把GPT和o系列模型整合在一起,并且支持视频、音频、图像的多模态交互。 Altman做了一个比喻,GPT-3到GPT-4是一次史诗级性能飞跃,而GPT-4再到GPT-5将会再一次重现这种惊喜。

美国新法案:禁止进口中国DeepSeek,违规罚1亿美元、监禁

在国内大模型DeepSeek席卷全球致使美国科技股暴跌后,美国参议员Josh Hawley提出《美国AI能力与中国脱钩》法案,以保护美国的AI开发不受中国影响。 Hawley在序言中写道:“流入中国AI的每一美元和每一字节数据,最终都会被用来对付美国。 美国不能在牺牲自身实力的情况下,增强我们最大的对手。

超越DragDiffusion!哈工程联合南大提出FastDrag:可以几秒内完成基于拖动的图像编辑

今天给大家介绍哈工程联合南大等提出的图像编辑方法FastDrag,该方法不需要LoRA训练,从而显著减少了图像编辑的时间消耗(FastDrag仅需3.12秒完成图像编辑),比DiffEditor快近700%(DiffEditor需要21.68秒完成图像编辑),比经典的基于n步迭代的图像编辑方法(如:DragDiffusion)快2800%(DragDiffusion需要1分21.54秒完成图像编辑)。 此外,即使没有使用LCM加速的情况下,所提出的FastDrag方法仍然比目前SOTA的方法快很多。 相关链接论文链接:: ,用户只需单击几下即可操作图像中的任何内容。

AI驱动新一轮社交工程攻击:该如何应对?

社交工程攻击长期以来一直是一种有效的策略,因为它专注于利用人类的弱点。 它不需要暴力破解密码,也不需要寻找未修补的软件漏洞。 相反,它只是通过操纵信任、恐惧和对权威的尊重等情感,来获取敏感信息或访问受保护的系统。

刚刚,Figure与OpenAI解除合作!人形机器人迎来iPhone时刻,AGI已在内部实现?

刚刚,爆火出圈人形机器人Figure与OpenAI终止合作了! 创始人Brett Adcock称,我们已经在端到端AI上取得了重大突破,且完全由内部团队独立研发。 「未来一个月,我们将会展示前所未有的机器人技术」。

人工智能的历史:从古代神话到现代机器,从图灵到未来

在人类宏伟成就的历史上,很少有演员能像人工智能一样如此引人注目、充满争议且大胆无畏。 深入人工智能 (AI) 的历史迷宫及其可能的未来,就像踏上一场穿越时空的冒险之旅,科幻小说与现实之间的界限比量子计算机解决魔方的速度更快。 请想象一下,如果有一天,机器不仅能执行任务,还能学习、适应和进化,你的烤面包机也许有一天会在国际象棋上胜过你,你的吸尘器也许能写出一首与莎士比亚媲美的十四行诗。

DeepSeek 全面指南:95% 的人都不知道的九个技巧

大家好,我是汤师爷~最近,DeepSeek这款AI工具爆火国内外。 虽然许多人都开始尝试使用它,但有人吐槽说,没想象中那么牛。 其实问题不在工具,很多人的使用姿势就搞错了,用大炮打蚊子,白白浪费DeepSeek的强大功能。

如何利用DeepSeek进行高效内容创作:提升效率与流量的终极指南

在当今信息爆炸的时代,内容创作者面临着巨大的竞争压力。 无论是公众号博主、自媒体人,还是技术写作者,都需要在短时间内产出高质量的内容,以吸引读者的关注并提升流量。 而随着人工智能技术的快速发展,像DeepSeek这样的AI工具正在成为内容创作的得力助手。

Meta连自己内部开发发布模型的流程都公开了:停止开发风险极高的AI系统,开源AI模型发布后监控方法

出品 | 51CTO技术栈(微信号:blog51cto)就在昨晚,Meta冷不防就把自家的大模型发布前的决策步骤对外公开了。 “我们在开发和发布前沿AI时遵循的流程的概述,以确保我们在整个过程中监控和管理风险。 我们的治理方法可以分为三个主要阶段:计划、评估和缓解、以及决策。

使用这些AI工作流来减少您的技术债务,你学会了吗?

利用AI和Dagger,自愈工作流有望通过自动化错误检测、生成测试覆盖率和迭代优化代码来提高代码质量。 译自Use These AI Workflows To Reduce Your Technical Debt,作者 Kambui Nurse。 技术债务通常是许多软件开发组织中,尤其是在构建和测试过程中创新的主要阻碍。

蛋白质设计新纪元:语言模型驱动的 5 亿年进化模拟

在生命科学的浩瀚星空中,蛋白质一直是最为璀璨的研究焦点之一。 近期,一项由 Thomas Hayes 等众多学者共同完成的研究成果 —— 利用语言模型模拟 5 亿年蛋白质进化,在《Science》杂志重磅发表,如同一颗超新星爆发,瞬间照亮了整个领域,为蛋白质研究开启了全新的篇章。 一、ESM3 模型架构揭秘ESM3 模型作为此项研究的核心成果,无疑是一座闪耀着创新光芒的科学丰碑。

「扩散模型+多模态提示」精准增强皮肤病变分割,超越GAN,SSIM提升9%,Dice提升5%!

一眼概览该论文提出了一种基于扩散模型的医学影像生成方法,结合视觉和文本提示,以精准控制皮肤镜病变图像的生成,提升皮肤病变的分割性能。 实验结果显示,该方法比传统GAN生成方法在图像质量(SSIM提升9%)和分割性能(Dice系数提升5%)上均有显著改进。 核心问题问题背景医学影像分析受限于公开数据集稀缺及高质量标注成本高,数据增强方法(如GAN)虽能扩充数据,但难以精准控制病变类型、位置及属性,导致对下游任务(如病变分割)的提升有限。

DeepSeek告诉我:程序员在AI时代不必焦虑

一、AI焦虑的本质:程序员为何担心被取代? 凌晨2点,程序员小王对着屏幕发呆。 GitHub Copilot刚帮他自动补全了代码,但看着一行行自动生成的函数,他突然感到后背发凉:“如果AI连代码都能写,我的价值在哪里?