资讯列表
传说中Ilya Sutskever精选论文清单:AI领域40大论文完整版「破解」完成
今年 5 月,一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。 网友称「Ilya 认为掌握了这些内容,你就了解了当前(人工智能领域) 90% 的重要内容。 」据说这份论文清单是 2020 年 OpenAI 的联合创始人、首席科学家 Ilya Sutskever 给另一位计算机领域大神,id Software 联合创始人,致力于转行 AGI 的 John Carmack 编写的。
11/16/2024 1:35:00 PM
机器之心
遏制电话诈骗新招:AI 老奶奶“废话反击”,40 分钟搞崩诈骗者心态
科技媒体 tomsguide 于 11 月 14 日发布博文,报道称英国电信运营商 O2 发布了名为“黛西”(Daisy)的 AI 老奶奶,专门遏制网络诈骗。
11/16/2024 11:03:18 AM
故渊
可口可乐发布首个完全由 AI 生成的广告:致敬 1995 年经典,但反响不如预期
游戏媒体 IGN 今天(11 月 16 日)发布博文,报道称可口可乐公司推出了首个完全由 AI 生成的视频广告,长度为 16 秒,致敬 1995 年经典“Holidays Are Coming”广告,但推出后遭遇巨大争议。
11/16/2024 10:44:45 AM
故渊
微软 GraphRAG AI 提效:改善数据检索,tokens 成本降低 77%
科技媒体 winbuzzer 昨日(11 月 15 日)发布博文,报道称微软研究院已更新 GraphRAG 系统,新增了动态社区(dynamic community)选择功能,在改善全局搜索的数据检索同时,tokens 用量减少了 77%。
11/16/2024 9:34:22 AM
故渊
欧盟发布《通用人工智能业务守则》初稿:明确 AI 风险管理指导方针
科技媒体 engadget 昨日(11 月 15 日)发布博文,欧盟已于 11 月 14 日发布《通用人工智能业务守则》初稿,共计 36 页,目标为开发和使用通用人工智能(GPAI)模型设立监管框架。
11/16/2024 8:33:24 AM
故渊
LLM 数学基准测试集 FrontierMath 公布:号称多数题型 AI 没学过、业界模型均败北
研究机构 Epoch AI 现公布了一款名为 FrontierMath 的全新 AI 模型数学基准测试集,旨在评估系列模型的数学推理能力。FrontierMath 的题目由人工智能学方面资深专家设计,相应问题号称不仅要求 AI 理解数学概念,还需要具备复杂情境的推理能力,以避免模型利用以前学习过的类似题目进行比对作答。研究机构表示,他们利用 FrontierMath 对当前市场上的 AI 模型进行初步测试,发现这些模型普遍表现不佳,包括此前在 GSM-8K、MATH 上取得近乎满分成绩的 Claude 3.5 和 GPT-4 等模型在 FrontierMath 中的解题成功率也均败北(成功率低于 2%)。
11/15/2024 7:42:46 PM
漾仔
字节即梦 AI 视频生成模型更新 P / S 2.0 Pro 双版本,全量开放使用
即梦 AI 宣布包含具有首帧一致性的 S2.0 Pro 和具有极高提示词遵循能力 P2.0 Pro 视频生成模型全量开放使用。
11/15/2024 5:59:17 PM
沛霖(实习)
在AI和LLM架构中实现零信任:安全且负责任的AI系统实践指南
在AI和大型语言模型快速发展的背景下,安全不能再被视为事后的考虑。 随着这些技术成为企业运营不可或缺的一部分,实施强有力的安全措施至关重要,然而,AI的安全超越了传统的网络安全实践——它还必须涵盖伦理考量和负责任的AI原则。 本指南为IT从业人员和决策者提供了一种在AI和LLM架构中应用零信任原则的综合方法,强调从基础层面融入伦理考量。
11/15/2024 4:39:35 PM
Vaibhav Malik
正确启动AI助手的策略与实践
由于AI的快速发展以及对错失恐惧症(FOMO)的担忧,GenAI项目往往采用自上而下的推动方式,企业领导者很容易对这项突破性技术产生过度兴奋的情绪,然而,当企业急于构建和部署时,往往会遇到与其他技术实施中出现的所有典型问题。 AI复杂且需要专业知识,这意味着一些企业很快就会陷入困境。 事实上,Forrester预测,尝试内部构建AI助手的企业中,有近四分之三将会失败。
11/15/2024 4:35:13 PM
Taryn Plumb
阿里通义代码模式上线:号称即便不懂编程,也能大白话一键生成应用
通义代码模式基于 Qwen2.5-Coder 模型开发,官方表示即便用户不懂代码和编程,也可用大白话让通义 AI 自动编码,网站、数据图表和小游戏等。
11/15/2024 4:33:10 PM
沛霖(实习)
这三家国内机构合作成果,斩获EMNLP 2024最佳论文奖,主办方:明年苏州见!
中科院计算所、中国科学院大学、中关村实验室合作的一篇论文拿到了 EMNLP 2024 最佳论文奖。 刚刚,EMNLP 2024 论文奖项结果出炉了! EMNLP 2024 会议近日在美国迈阿密盛大开幕,现场热闹非凡。
11/15/2024 4:13:00 PM
机器之心
大模型容易忽视的安全,火山方舟早就「刻」进了基因
大模型时代,企业使用云上模型的痛点有哪些? 你可能会说模型不够精准,又或者成本太高,但这些随着AI技术的快速发展,在不远的将来或许都不再是问题。 比如成本,自豆包大模型首次将价格带进“厘”时代以来,行业纷纷跟进,企业客户从此不再为使用模型的成本过度高昂而烦扰。
11/15/2024 4:03:00 PM
代聪飞
集成500+多模态现实任务!全新MEGA-Bench评测套件:CoT对开源模型反而有害?
随着人工智能技术的进步,多模态大模型正逐渐应用于多个领域,极大地提升了机器在视觉、文本等多种信息模式下的理解和生成能力。 这些模型不仅用于对话、图片标注、视频分析等较常见的任务,还被广泛应用在复杂场景中,如程序编写、医疗影像诊断、自动驾驶、虚拟助手中的多模态交互,甚至用于游戏策略分析与操作应用程序。 然而,全面、系统地评测多模态大模型的能力需要投入大量的资源。
11/15/2024 3:38:00 PM
新智元
新Scaling Law浮出水面!OpenAI内部员工爆料下一代模型Orion性能堪忧;量化Llama3困难,这些都有了新解
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)Scaling Law 最近被业内不少人士唱衰,一方面以OpenAI为代表大模型厂商们,基本上还是围绕着GPT-4在探索周边,虽说不是原地打转,但单就性能提升而言,就连OpenAI自家的员工都爆料说非常有限。 1.OpenAI内部人士:Orion性能提升遇到瓶颈昨天,外媒媒体曝出消息称,奥特曼一直吊胃口的下一代模型“Orion”,也被自家的两位知情人士,坦承:GPT-4与Orion之间的质量差距明显小于GPT-3与GPT-4之间的差距,并透露截止到夏末,Orion在回答未经训练的编码问题时表现不佳,仅在语言处理能力方面显示出提升。 这可影响大了,业界都在向着OpenAI学习、追赶,OpenAI的放缓自然也就意味着大模型进展在放缓。
11/15/2024 3:31:44 PM
言征
马斯克与阿尔特曼的法律纠纷升级:OpenAI 被指试图垄断生成式 AI 市场
据彭博社今日报道,埃隆·马斯克与萨姆·阿尔特曼的矛盾进一步升级,马斯克在法庭文件中指控 OpenAI 意图垄断生成式人工智能市场,在竞争中忽视了安全问题。
11/15/2024 2:07:24 PM
清源
多个中国团队斩获EMNLP'24最佳论文!UCLA华人学者中三篇杰出论文,明年顶会落户苏州
刚刚,EMNLP 2024最佳论文奖新鲜出炉! 5篇中榜论文中,华人学者参与三篇,分别来自CMU、上海交通大学、中国科学院大学等机构。 其中,Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method主要由中科院网络数据科学与技术重点实验、中国科学院大学的学者完成。
11/15/2024 2:00:00 PM
量子位