应用

AI 视频生成王者 Sora 上线:OpenAI 的“魔法棒”,1080P@20 秒具象化你的想象力

OpenAI 公司昨日(12 月 9 日)发布博文,宣布正式推出 Sora 文生视频 AI 模型,邀请 ChatGPT Plus 和 ChatGPT Pro 用户,通过访问 sora.com 网站,生成最高分辨率 1080p、时长达 20 秒的视频,并支持宽屏、竖屏和方形比例。

微软 AI 掌门人苏莱曼不看好 OpenAI 阿尔特曼对 AGI 的预判:当前硬件无法实现

据 The Verge 今晚报道,微软 AI CEO 穆斯塔法・苏莱曼对 OpenAI CEO 山姆・阿尔特曼的最新表态提出了异议,称当前硬件无法实现 AGI。

智谱首个免费多模态模型 GLM-4V-Flash 上线,支持图像描述生成、视觉问答等

继 8 月语言模型 GLM-4-Flash 免费后,智谱 AI 在今天上线第一款免费的多模态模型 —— GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。

国家知识产权局拟明确:AI 系统无法成为发明人,专利文件署名的发明人必须是自然人

对于人工智能辅助作出的发明,对发明创造的实质性特点作出了创造性贡献的自然人,可以署名为专利申请的发明人。但人工智能自主生成发明,就无法被赋予发明人身份。

百川智能联合创始人洪涛离职,曾任搜狗公司首席营销官

百川智能方面回复称:“洪涛因个人原因已从公司离职。在公司创立初期,他快速搭建了商业化团队,为公司发展奠定了基础。我们非常感谢他的付出和贡献。”

Sora 二代实机演示曝光:解锁图生视频,阿尔特曼暗示“期待周二”

Sora 至今还未开放,但第二代已曝光!在人物神态等细节方面的刻画更加精进了,群像也能很好地生成。

OpenAI 六年元老再发文:全球 AI 狂飙,我们应该拉手刹还是踩油门

前段时间离职后留下公开辞职博客的 OpenAI 六年元老 Miles Brundage 最近再发一文,讨论了一个相当热门但棘手的问题:当今的 AI 发展速度,应该加速、减速还是维持现状?

美国一大学将开设独特文学课程,教材、作业全部由 AI 生成

2025 年冬季加州大学洛杉矶分校(UCLA)将开设一门比较文学课程(comparative literature class),其教材、作业和助教资料均由人工智能生成。

LLM最大能力密度100天翻一倍!清华刘知远团队提出Densing Law

支持大模型一路狂飙的 Scaling Law 到头了? 近期,AI 圈针对 Scaling Law 是否到头产生了分歧。 一派观点认为 Scaling Law 已经「撞墙」了,另一派观点(如 OpenAI CEO Sam Altman)仍然坚定 Scaling Law 的潜力尚未穷尽。

新版Sora要来了?泄露视频引围观,网友:价格别太离谱

Sora 真的要来了? 最近几天,OpenAI 开启了为期 12 天的连续发布,第一天发布的 o1 完全体和 200 美元一个月的 ChatGPT Pro 刷新了外界对 AI 大模型定价的认知;第二天发布的强化微调(Reinforcement Fine-Tuning)则吸引了大批研究者和开发者的兴趣。 那第三天发什么呢?

孙悟空骑摩托车、《甄嬛传》变“枪战片”,广电总局发布 AI“魔改”管理提示要求排查清理相关短视频

12 月 7 日,广电总局网络视听司发布《管理提示(AI 魔改)》,近期,AI“魔改”视频以假乱真、“魔改”经典现象频发。如《甄嬛传》变身“枪战片”,《红楼梦》改成“武打戏”,孙悟空骑着摩托车扬长而去等。

首个 VR 端 3D 角色扮演 AI 发布:端到端 VLA 模型驱动,唱跳都能陪你玩

SOLAMI 是一个创新的 VR 端 3D 角色扮演 AI 系统,用户可以通过语音和肢体语言与虚拟角色进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。

OpenAI 宣布与武器制造商合作,内部员工发声反对

在上周三发布的一份联合声明中,OpenAI 与国防科技初创公司 Anduril Industries 共同宣布,双方将建立战略合作伙伴关系,以开发和负责任地部署用于国家安全任务的先进人工智能(AI)解决方案。

中国移动联合研发 2D 数字人说话驱动系统:可生成 7 种情绪,用于 5G 新通话、AI 客服等

数字人生成技术上实现了端到端的二阶段 30 FPS 实时生成性能,并支持 512*512 人脸区域生成,同时具备高兴、悲伤等 7 种主流情绪控制生成能力。

北交开源 o1 代码版:强化学习 + 蒙特卡洛树搜索,放出源代码、精选数据集以及衍生模型

团队认为编码是一个需要 System-2 思维方式的典型任务,涉及谨慎、逻辑、一步步的问题解决过程。而他们的策略是将强化学习(RL)与蒙特卡洛树搜索(MCTS)相结合,让模型能够不断生成推理数据,提升其 System-2 能力。

SIGGRAPH Asia 2024:传统与创新并存,3D 生成与具身智能热度上升

作者丨朱可轩编辑丨陈彩娴今日,历时四天(12.3-12.6)的第十七届 SIGGRAPH Asia 在东京正式闭幕,本届围绕的主题为「Curious Minds」,无论是参与注册的人数还是论文投稿数都创下了历史新高。 华人学者在本次大会上的表现依旧十分亮眼,在会场,几乎大多数论文背后都有华人的身影。 当前,在计算机视觉学界主要有新兴派和传统派两类研究者,前者的目光主要聚焦在具身智能和 3D 生成方向,而后者则依旧专注于解决几何建模和几何处理中的细节问题。

张一鸣被曝全力押注 AI,亲自监督字节跳动招聘高端人才

字节跳动内部人士说,张一鸣亲自监督了从竞争对手公司招聘 AI 工程师和研究人员的工作。张一鸣在内部谈到了他的“通用人工智能”目标,即具有类似人类智能的系统。(英国《金融时报》)

多家国内银行采用 AI 面试进行招聘,以提高效率

据经济观察报报道,2024 年,中国银行、工商银行、农业银行、邮储银行、交通银行、建设银行以及中原银行、杭州银行、浙商银行、上海银行等银行的分支机构采用了 AI 面试来优化招聘流程,以提高效率。