资讯列表

传音控股与阿里云达成合作,通义千问大模型搭载于前者旗下 AI 手机

传音控股(以下简称传音)已与阿里云达成合作,通义千问大模型已经搭载在传音旗下科技品牌 TECNO 推出的 AI 手机 PHANTOM V Fold2 中,打造了深度本地化的“实用型 AI”。通过机身上特定的 AI 按键,用户可一键调用端侧大模型,在离线环境中依然可以流畅运行多轮 AI 对话,并实现文档及通话摘要。

AI华佗?港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

编辑 | 白菜叶OpenAI o1 的突破凸显了通过增强推理能力来提高自然语言大模型(LLM)的应用潜力。 然而,大多数推理研究都集中在数学任务上,而医学等领域尚未得到充分探索。 医学领域虽然不同于数学,但鉴于医疗保健的高标准,它也需要强大的推理能力来提供可靠的答案。

简化芯片设计传统,AI训练的新型算法正改变芯片研发范式

编辑丨&自1971年第一个商用微处理器的草图面世以来,芯片设计已经取得了长足的进步。 但是,随着芯片变得越来越复杂,设计人员必须解决的问题也越来越复杂。 而我们目前的工具并不总是能胜任这项任务。

推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

随着语音技术在各领域应用的迅速扩展,全球语言与口音的多样性成为技术进一步突破的重大挑战。 为了应对这一难题,来自卡内基梅隆大学(CMU)、斯坦福大学(Stanford University)、乔治梅森大学(George Mason University)、台湾大学与芝加哥丰田技术学院(TTIC)的研究团队连手,在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛(Multilingual SUPERB 2.0 Challenge)。 该挑战旨在推动多语言语音技术迈向新高度,为语音科技的全球化应用奠定坚实基础。

奥特曼崩溃认错:ChatGPT被用户薅秃,OpenAI亏大了!专访痛忆宫斗事件

奥特曼后悔了! 最近,奥特曼在采访中曝出,当初对于ChatGTP Pro的定价是自己拍脑门决定的。 结果没想到用户实在薅得太狠,直接把OpenAI薅秃了,严重亏损!

CES 2025:AMD锐龙9000新品亮相,游戏、创作力表现超Intel旗舰

已经领先的 AMD,还在扩大优势。 1 月 6 日,AMD 在拉斯维加斯举行的 CES 2025 上进行了重要发布,展示了旗下最新一代高端 CPU 和 GPU。 昨晚的发布覆盖 AMD 的所有消费级产品线,包括用于 AI PC 的全新 Ryzen AI Max、Ryzen AI 300 和 Ryzen AI 200 CPU,以及用于游戏台式机和笔记本电脑以及手持游戏系统的高性能芯片。

具身智能赛道喜迎“开门红” ,智平方宣布完成Pre-A轮融资

DEEPSeek之后,中国科创又迎来好消息! 智平方的国产具身大模型,在通用空间感知、泛化操作成功率上大幅超越硅谷头部模型,为中国自主可控的物理世界大模型以及机器人赛道,带来一剂强心针! 与此同时,凭借强大的产业能力,智平方的软件产品 AI2R Brain 以及 Alpha Bot 爱宝机器人已经得到客户积极认可。

RTX5090震撼发布,国行16499元起,黄仁勋「美国队长」pose亮翻全场

老黄穿上了新皮衣,拿来了新 GPU。 今天上午,全世界的目光都集中在了拉斯维加斯。 北京时间 1 月 7 日上午 10 点半,英伟达 CEO 黄仁勋在拉斯维加斯 CES 2025 展会上发表了主题演讲(keynote),涉及到的话题包括 GPU、AI、游戏、机器人等等。

手机「自动驾驶」大揭秘!vivo万字综述探讨大模型手机自动化

导言你是否想过,手机能像电影钢铁侠中的智能管家贾维斯那般,一句话就能顺畅自如地完成各种复杂任务。 最近国内外的手机厂商和 AI 公司纷纷发布了手机 AI 智能体相关产品,让曾经的幻想逐渐有了可行性。 vivo 作为行业领跑者,在十月的开发者大会上推出了其手机智能体产品 “PhoneGPT",能帮用户实现一句话点咖啡、订外卖、甚至能够一句话找到最近的私房菜馆并通过 AI 实现电话预定包厢,被网友们称作 “i 人救星”。

单张图像探索3D奇境:Wonderland让高质量3D场景生成更高效

本文的主要作者来自多伦多大学、Snap Inc.和UCLA的研究团队。 第一作者为多伦多大学博士生梁汉文和Snap Inc.的曹军力,他们专注于视频生成以及3D/4D场景生成与重建的研究,致力于创造更加真实、高质量的3D和4D场景。 团队成员期待与更多志同道合的研究者们交流与合作。

OpenAI给不了的,DeepMind给,Sora联合负责人跳槽后开组新团队

在 Sora 发布即翻车之前,其团队掌舵人 Tim Brooks 在社交媒体上宣布跳车,跳槽的去向还是竞争对手谷歌 DeepMind。 据 The Information 爆料,Tim Brooks 的出走是因为 Sora 技术存在严重问题:不仅生成速度慢,还在各项性能上都难以与 Luma、Stability、Runway 等对手抗衡,更别提最近风头正劲的 Pika 和国产视频生成模型们了。 在 Sora 还在闭门造车的这段时间,竞争对手们已经在市场上攻城略地,打得火热。

终于把机器学习中的超参数调优搞懂了!!

今天给大家分享机器学习中一个重要的知识点,超参数调优超参数调优(Hyperparameter Tuning)是机器学习模型开发过程中一个关键步骤,旨在通过调整模型的超参数来优化模型的性能。 超参数不同于模型参数,后者是在训练过程中通过数据学习得到的,而超参数是在训练之前设定的,通常需要通过试验和优化来确定。 什么是超参数超参数是指在训练机器学习模型之前需要人为设定的参数。

陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减

陈丹琦团队又带着他们的降本大法来了——数据砍掉三分之一,大模型性能却完全不减。 他们引入了元数据,加速了大模型预训练的同时,也不增加单独的计算开销。 在不同模型规模(600M - 8B)和训练数据来源的情况下,均能实现性能方面的提升。

类 Mac Mini 大小的个人 AI 超算:英伟达 Project Digits 发布,起价 3000 美元

Project Digits 的核心是新的 GB10 Grace Blackwell Superchip,它具有足够的处理能力来运行复杂的 AI 模型,同时又足够紧凑,可以放在桌子上并使用标准电源插座供电。

Sora核心作者掌舵,谷歌世界模型新团队全球招募:百万底薪起步

最新消息,Sora核心作者,将领导谷歌世界模型团队! Tim Brooks——带队Sora研究的两位负责人之一,也是DALL-E 3作者之一,刚刚发布了一条热情四溢的推特,广纳天下英才:DeepMind有雄心勃勃的计划,要制作大量世界模型。 向着这个使命,我开始招募一个新团队。

Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑

本文经AIGC Studio公众号授权转载,转载请联系出处。 InstructMove是一种基于指令的图像编辑模型,使用多模态 LLM 生成的指令对视频中的帧对进行训练。 该模型擅长非刚性编辑,例如调整主体姿势、表情和改变视点,同时保持内容一致性。

2025 年 AI 与数据工程领域十大趋势前瞻

业内专家们曾预言,2024 年将成为生成式 AI 的里程碑之年。 实际应用案例不断涌现,技术进步使得进入该领域的门槛不断降低,而通用人工智能似乎也近在咫尺。 那么,这些预测都实现了吗?

复旦&字节提出layout-to-image新范式,支持基于布局的MM-DiT架构下可控图像生成!

本篇分享论文CreatiLayout: Siamese Multimodal Diffusion Transformer for Creative Layout-to-Image Generation,是由复旦大学&字节跳动提出的layout-to-image新范式,支持基于布局的MM-DiT架构下的可控图像生成! 效果示例相关链接论文地址: : : : : (Layout-to-Image, L2I) 是一种基于布局信息进行可控图像生成的技术,其中布局信息包括实体在图像中的空间位置和描述。 例如,用户指定了这些实体的描述与空间位置:钢铁侠手里拿着画板,站在岩石上,画板上用手绘字体写着“CreatiLayout”,背景是海边与日落。