AI资讯列表 - AI在线

沃顿商学院教授发文解析 o1：能力仍有短板，「人机协同智能」或成 AGI 最重要难题

OpenAI 最近奉上了满血版的 o1 Pro，这一全新系列的模型究竟有多强？它能否指明 AI 发展的未来方向？沃顿商学院教授在 3 个月的前一篇博客就中给出了「神预言」一般的答案。

ELMo模型可用于训练动态词向量，该模型有哪些优缺点？与BERT模型之间的区别是什么？｜深度学习｜大模型

ELMo（Embeddings from Language Models）是一种基于深度学习的动态词向量模型，它通过双向LSTM（长短期记忆网络）来生成词的表示，相较于传统的静态词向量方法，如Word2Vec和GloVe，ELMo能够根据上下文生成不同的词向量。这使得ELMo能够更好地处理同义词、歧义词以及多义词的上下文依赖关系，从而提升自然语言处理（NLP）任务的表现。然而，ELMo也存在一些局限性，例如模型训练复杂、计算资源消耗较大以及缺乏对长距离依赖的建模等。

视频生成平台 Pika 推出 2.0 更新：上传自拍秒变好莱坞大片，和明星同框不是梦

Pika 2.0 上线不久即引发全网狂潮，强大场景元素功能、超强文本对齐、深刻物理学理解，让它在 AI 视频大混战中脱颖而出，效果不输谷歌 Veo 2.0。网友们疯狂实测，人手一部广告大片。

多种思维链-CoT

初步知识在本节中，我们提供了标准提示和思维链推理的初步知识。定义以下符号：问题 Q、提示T 、概率语言模型PLM 和预测A 。少样本标准提示少样本思维链提示思维链推理的优势作为一种新颖的推理范式，思维链推理具有多种优势：提升推理能力：思维链推理将复杂问题分解为可管理的步骤，并建立这些步骤之间的联系，从而促进推理。

微信公众号新增“作者朗读音色”功能：可生成作者音色全文音频

官方表示，作者需要下载“公众号助手”App，点击“我-设置-朗读音色”，就可以录制例句，例句也会复刻作者的语气和情感。

新SOTA，浙大、中科院深度学习模型可靠、准确预测蛋白-配体，助力药物开发

编辑 | 萝卜皮准确预测蛋白质-配体相互作用对于理解细胞过程至关重要，目前仍面临着诸多挑战。中国科学院、浙江大学的研究人员提出了 SurfDock，这是一种深度学习方法，通过将蛋白质序列、三维结构图和表面级特征整合到等变架构中来解决这一挑战。 SurfDock 在非欧几里德流形上采用生成扩散模型，优化分子平移、旋转和扭转以生成可靠的结合姿势。

Science子刊，理解更真实的溶液，ML力场将速度提升六个数量级，更高效表征水分子时空关系

编辑丨toileter水不仅是人类最熟悉的物质之一，也是物理化学悠久历史中的核心人物。其分子间具有的四面体排列与网络相互作用使其有别于简单液体。长久以来，关于水中是否存在液-液临界点（LLCP），始终没有得出一个具体的结果。

智驾公司下场搞AI视频生成，模型上线即开源

AI好好用报道编辑：杨文人人免费可用。大洋彼岸，两大巨头 OpenAI 和谷歌轮番炸场。一个发布了那个传说中的 Sora，一个推出了最强视频生成模型 Veo2。

李飞飞团队统一动作与语言，新的多模态模型不仅超懂指令，还能读懂隐含情绪

人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通，我们既使用言语语言，也使用身体语言，比如手势、面部表情、身体姿势和情绪表达。因此，为了理解和生成人类动作，理解这些多模态的行为至关重要，而且这一研究方向最近受到的关注也越来越多。

Scaling Law撞墙？预训练终结？亚马逊云科技为什么还在做基础大模型

12 月 2-6 日，亚马逊云科技在美国拉斯维加斯举办了今年度的 re:Invent 大会。会上，亚马逊云科技发布了相当多东西，其中之一便是新的大模型系列 Nova。说实话，这确实出乎了相当多人的意料 —— 毕竟亚马逊已经重金押注 Anthropic，似乎没有必要再自起炉灶了。

英伟达下代RTX 50系列显卡规格被泄露，旗舰5090显存达32GB

自 2022 年 10 月以来，高端显卡性能终于又将迎来大幅度升级。明年的国际消费类电子产品展览会（CES 2025）将在北京时间 1 月 8 日至 11 日举行，包括英特尔、英伟达和 AMD 在内的各大 CPU、GPU 厂商将带着自家最新产品闪亮登场。大家最期待的应该当属英伟达的最新 RTX 50 系列显卡了，到时候肯定会成为全场的焦点。

Meta 推出 Apollo 开源模型，让 AI “看懂”视频

Meta携手斯坦福大学，推出全新AI模型系列Apollo，显著提升机器对视频的理解能力。Apollo的研发解决了AI领域长期存在的难题，并为视频理解领域树立了新的标杆。

Florence-VL来了！使用生成式视觉编码器，重新定义多模态大语言模型视觉信息

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

见证历史！AI想的科研idea，真被人类写成论文发表了

天啦撸！！ AI想出来的idea，还真有人写成论文了。

让多视角图像生成更轻松！北航和VAST推出MV-Adapter

大模型超强内存优化：成本削减高达75%，性能不减弱！成果出自日本一初创AI公司之手；网友：电力可能够用了！

出品 | 51CTO技术栈（微信号：blog51cto）一项逆天的大模型优化技术来了！东京初创公司Sakana AI的研究人员开发了一种新技术，让大模型能够更有效地使用内存，不仅最多节省75%的内存占用，还甚至性能也有所提升！这种名为“通用Transformer内存”的技术使用特殊的神经网络优化LLM，保留重要的信息并丢弃冗余的细节。

谷歌发布 FACTS Grounding 基准：Gemini、GPT-4o、Claude 当评委，成 AI 大语言模型“幻觉照妖镜”

12 月 18 日消息，谷歌 DeepMind 团队于 12 月 17 日发布博文，宣布推出 FACTS Grounding 基准测试，评估大型语言模型（LLMs）根据给定材料是否准确作答，并避免“幻觉”（即捏造信息）的能力，从而提升 LLMs 的事实准确性，增强用户信任度，并拓展其应用范围。数据集在数据集方面，ACTS Grounding 数据集包含 1719 个示例，涵盖金融、科技、零售、医疗和法律等多个领域，每个示例包含一篇文档、一条要求 LLM 基于文档的系统指令和随附的提示词。示例文档长度不一，最长可达 32000 个 token（约 20000 字）。

谷歌逆风翻盘暴击OpenAI，90天王者归来！44页报告押注25年三大技术前沿

逆袭之战开启，谷歌用90天重回巅峰！短短90天，谷歌就从业内笑柄，逆袭成突破最大、产品最颠覆的科技大公司。用AI初创创始人Ole Lehmann的话说，「我们正在见证2024年最大的科技转变」。

资讯列表