应用

Anthropic 新研究:AI 模型在训练中存在“阳奉阴违”行为

人工智能安全公司 Anthropic 发布一项最新研究揭示了人工智能模型可能存在的欺骗行为,即在训练过程中,模型可能会伪装出接受新原则的假象,实则暗地里仍然坚持其原有偏好。研究团队强调,目前无需对此过度恐慌,但这项研究对于理解未来更强大人工智能系统可能构成的潜在威胁至关重要。

OpenAI ChatGPT Canvas 进化:React 渲染和文本格式化工具即将来袭

科技媒体 testingcatalog 昨日(12 月 18 日)发布博文,报道称 OpenAI 正积极提升 ChatGPT Canvas 功能,新增 React 渲染功能和“Transform”高级文本格式化选项。

监管机构预测北美最早明年出现大面积停电,罪魁祸首是人工智能

随着 iOS 18.2 的公开发布,Apple Intelligence 的诸多新功能上线,北美电力可靠性公司(NERC)发出警告,人工智能(AI)应用的爆炸式增长可能导致美国和加拿大最早于明年就面临大面积停电的风险。

开启全民 AI 时代:OpenAI 加速普及 ChatGPT,开通热线电话、新设 WhatsApp 机器人

“12 Days of OpenAI”进入第 10 天,OpenAI 公司在今天(12 月 19 日)的直播活动中,进一步探索新的交互方式,在美国推出 ChatGPT 热线电话(1-800-242-8478),用户拨打后可与 ChatGPT 进行语音对话。

微调时无需泄露数据或权重,这篇AAAI 2025论文提出的ScaleOT竟能保护隐私

蚂蚁数科、浙江大学、利物浦大学和华东师范大学团队:构筑更好的大模型隐私保护。 要让大模型适应各不一样的下游任务,微调必不可少。 常规的中心化微调过程需要模型和数据存在于同一位置 —— 要么需要数据所有者上传数据(这会威胁到数据所有者的数据隐私),要么模型所有者需要共享模型权重(这又可能泄露自己花费大量资源训练的模型)。

LG Display:AI 缩短九成质量异常处理用时,每年节约超 2000 亿韩元

LG Display 认为 AI 技术的引入能让员工有更多的时间和精力专注于高附加值的工作而不是用在可由 AI 代劳的数据收集与分析上。

字节即梦 AI 图片模型 2.1 上线,号称“一句话生成海报”

字节跳动旗下即梦 AI 宣布,全新图片模型 2.1 已正式上线。支持通过简单的指令,控制文字的颜色和位置等元素,快速生成中英文图像海报。

思必驰俞凯:分布式大模型智能体系统是 AGI 时代一道别样的风景

作者丨朱可轩编辑丨陈彩娴历时两天(12.10-12.11),今年的 2024 全球人工智能产品应用博览会已在苏州工业园区完美闭幕。 在第一天下午的大会主论坛中,思必驰联合创始人、首席科学家俞凯以「迈向分布式大模型智能体系统」为主题,深入探讨了思必驰在大模型技术路线上的独到思考,以及其对行业的观察和见解。 「分布式大模型智能体系统」是思必驰在深耕对话式人工智能领域十七年后探索出的新发展方向,即:1 个中枢大模型 N 个垂域模型及全链路交互组件组成全功能系统。

沃顿商学院教授发文解析 o1:能力仍有短板,「人机协同智能」或成 AGI 最重要难题

OpenAI 最近奉上了满血版的 o1 Pro,这一全新系列的模型究竟有多强?它能否指明 AI 发展的未来方向?沃顿商学院教授在 3 个月的前一篇博客就中给出了「神预言」一般的答案。

视频生成平台 Pika 推出 2.0 更新:上传自拍秒变好莱坞大片,和明星同框不是梦

Pika 2.0 上线不久即引发全网狂潮,强大场景元素功能、超强文本对齐、深刻物理学理解,让它在 AI 视频大混战中脱颖而出,效果不输谷歌 Veo 2.0。网友们疯狂实测,人手一部广告大片。

微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频

官方表示,作者需要下载“公众号助手”App,点击“我-设置-朗读音色”,就可以录制例句,例句也会复刻作者的语气和情感。

智驾公司下场搞AI视频生成,模型上线即开源

AI好好用报道编辑:杨文人人免费可用。 大洋彼岸,两大巨头 OpenAI 和谷歌轮番炸场。 一个发布了那个传说中的 Sora,一个推出了最强视频生成模型 Veo2。

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

人类的沟通交流充满了多模态的信息。 为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。 因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。

英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB

自 2022 年 10 月以来,高端显卡性能终于又将迎来大幅度升级。 明年的国际消费类电子产品展览会(CES 2025)将在北京时间 1 月 8 日至 11 日举行,包括英特尔、英伟达和 AMD 在内的各大 CPU、GPU 厂商将带着自家最新产品闪亮登场。 大家最期待的应该当属英伟达的最新 RTX 50 系列显卡了,到时候肯定会成为全场的焦点。

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

Meta携手斯坦福大学,推出全新AI模型系列Apollo,显著提升机器对视频的理解能力。Apollo的研发解决了AI领域长期存在的难题,并为视频理解领域树立了新的标杆。

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

用 AI 帮助“打灰”,缪昌文院士目标将混凝土的设计寿命延长到 200 年

建筑材料专家、中国工程院院士、东南大学教授缪昌文透露,目前重大工程使用的混凝土材料的设计寿命为 100—120 年,他们希望通过人工智能技术,将混凝土的设计寿命延长到 200 年。

字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品

豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。