资讯列表

解决“佛跳墙、老婆饼”问题,联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”

同时通过引入海量中文图文对数据进行预训练,模型对中文专属名词,如鼠标-老鼠、仙鹤-吊车等英文模型易混淆的对象,以及中文菜谱等英文模型无法理解的名词,都能够准确理解并生成对应的图片。

OpenAI 最强对手 Anthropic 拟融资 20 亿美元,估值飙升至 600 亿美元

据纽约时报报道,知情人士透露,旧金山人工智能初创公司 Anthropic 正在进行新一轮融资谈判,公司估值有望达到 600 亿美元,较不到一年前的约 160 亿美元大幅攀升。

特斯拉 Cybertruck 拉斯维加斯爆炸案细节曝光:嫌犯用 ChatGPT 协助策划

执法官员称,37岁的嫌犯马修·艾伦·利弗尔斯伯格曾向ChatGPT询问如何制造爆炸物、爆炸物需要多快的速度才能引发爆炸而不仅仅是着火,并探讨如何规避法律获得相关材料。

深度伪造威胁升级:个性化伪造时代来临

谷歌DeepMind和斯坦福大学的研究人员仅通过简单的访谈,就创建出了1000多名人员的高效AI复制品。 谷歌和斯坦福大学的研究人员表示,与AI模型进行两小时的对话,就足以相当准确地刻画出真人的性格特征。 在最近的一项研究中,研究人员基于与每位参与者进行的两小时访谈,生成了1052名“模拟主体”(即AI复制品),这些访谈遵循了美国之声项目(AmericanVoices .

【LLM&Agent】PPTAgent:PPT自动生成Agent框架

来看一个PPT生成思路:PPTAgent。 传统的PPT生成方法通常使用端到端的文本生成范式,这种方法仅关注文本内容,忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式,解决处理空间关系和设计风格方面的挑战。

黄仁勋:英伟达 AI 芯片性能增速远超摩尔定律设定的标准

在拉斯维加斯举行的国际消费电子展 (CES) 上,英伟达 CEO 黄仁勋在一次面向万人的主题演讲后接受 TechCrunch 采访时表示,其公司 AI 芯片的性能提升速度已远超数十年来推动计算机技术进步的“摩尔定律”设定的标准。

3 到 5 秒即可同声传译 40 余种语言,时空壶推出 W4 Pro 实时翻译耳机

AI通讯科技公司时空壶宣布在CES 2025展会期间推出最新的W4 Pro耳机,其内置双向通话功能,支持跨语言实时翻译,可让用户在语音、视频通话中实现跨语言沟通能力,且不限通讯平台。

剑指专业领域零部件级3D生成!Meta联手牛津推出全新多视图扩散模型

当前AI生成的3D模型,已经拥有相当高的质量。 但这些生成结果通常只是单个物体的某种表示(比如隐式神经场、高斯混合或网格),而不包含结构信息。 对于专业应用和创意工作流来说,除了高质量的形状和纹理,更需要可以独立操作的「零部件级3D模型」。

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

在当今数字时代,智能助手已成为处理跨平台任务的不可或缺工具。 然而,如何将用户的自然语言指令精准映射(grounding)到界面元素一直是该领域的核心挑战。 传统解决方案主要依赖调用无障碍API、解析HTML源码或提取后台数据,这些方法普遍存在效率低下、信息不完整、兼容性差等显著痛点,严重制约了自动化技术的广泛应用。

英伟达亮相CES 2025:AI新前沿背后的动力源泉

CES 2025充分展现了英伟达的影响力,这种影响力不仅体现在英伟达自身的产品发布上,还体现在众多其他公司的产品和服务中。 CES 2025再次证明,其是全球突破性创新的舞台,而AI已成为几乎所有重大发布的核心。 英伟达是这场AI革命的核心,该公司一直将自己定位为AI和计算领域的领导者。

够新!够权威!智源研究院发布2025十大AI技术趋势

扫码下载报告全文

谷歌组建新AI团队开发“世界模型”:通往AGI的关键路径

最近谷歌组建一个新团队,专门开发可以用来模拟物理世界的AI模型,也就是所谓的“世界模型”(World Models)。 蒂姆·布鲁克斯(Tim Brooks)原本是OpenAI的一名高管,也是视频生成工具Sora的主要开发者之一。 去年10月,他加入谷歌DeepMind,成为新领导之一。

AWS自动推理负责人:与其解决AI幻觉,不如证明是否正确;Rust借用检查器实际上就是一个推理引擎

编辑 |  言征出品 | 51CTO技术栈(微信号:blog51cto)AI 的一个显着缺陷是它会不自知地“产生幻觉”,编造没有真实数据依据的合理答案。 AWS 正试图通过解决这个问题,一个不错的路径是:引入 Amazon Bedrock 自动推理检查。 Amazon Bedrock 是一项面向生成式 AI 应用程序的托管服务。

微软CEO开年演讲:预训练Scaling Law依然伟大!首个英伟达GB200集群已上线!未来手搓智能体就像建Excel一样简单

编辑|伊风刚刚,纳德拉在CEOMicrosoft India进行了一场新年的第一场演讲! 作为开年重磅,这场演讲可谓干货满满。 纳德拉开门见山地说,“在某种程度上,对我来说,微软始终专注于两件事:我们是一家平台公司,也是一家合作伙伴公司。

吴恩达对话业界领袖:揭秘2025人工智能五大风口

吴恩达(Andrew Ng)在新年伊始,与我们分享了他对人工智能未来发展的个人见解,吴老师特别指出,AI正在降低软件开发成本,使得快速构建软件原型变得前所未有的容易。 无论是为孩子制作抽认卡,还是管理国际账户的外汇汇率,亦或是自动分析用户评论以快速发现产品问题,AI辅助编码都能迅速实现这些应用。 吴恩达认为,AI辅助编码在原型开发中尤为有效,因为原型通常不需要复杂的上下文和软件集成,且在早期测试阶段对可靠性的要求相对较低。

AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3

近日,中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。 论文中提出的 Falcon 方法是一种增强半自回归投机解码框架,旨在增强 draft model 的并行性和输出质量,以有效提升大模型的推理速度。 Falcon 可以实现约 2.91-3.51 倍的加速比,在多种数据集上获得了很好的结果,并已应用到翼支付多个实际业务中。

黄仁勋圈重点的世界模型平台是个啥?技术报告全解析,华人贡献中坚力量

AI 的下一个前沿是物理。 在昨天的 CES 发布会上,英伟达 CEO 黄仁勋通过一个名为「Cosmos」的平台点明了这一主题。 简单来说,Cosmos 是一个世界模型平台,上面有一系列开源、开放权重的视频世界模型,参数量从 4B 到 14B 不等。

o1也会「想太多」?腾讯AI Lab与上海交大揭秘o1模型过度思考问题

本文的共同通讯作者为涂兆鹏和王瑞,涂兆鹏为腾讯专家研究员,研究方向为深度学习和大模型,在国际顶级期刊和会议上发表学术论文一百余篇,引用超过9000次。 担任SCI期刊NeuroComputing副主编,多次担任ACL、EMNLP、ICLR等国际顶级会议领域主席。 王瑞为上海交通大学副教授,研究方向为计算语言学。