资讯列表

DeepSeek-R1 持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

刚刚,DeepSeek-R1 跻身大模型竞技榜前三。以开源、便宜 20 倍的“身价”与 ChatGPT-4o(2024.11.20)并列。

免费体验:微软 Copilot 开放“深度思考”,你的专属 AI 策略顾问

科技媒体 Windows Latest 昨日(1 月 24 日)发布博文,报道称微软正开始邀请 Copilot 用户,免费体验“深度思考”(Think Deeper),会花费更多时间分析问题,并逐步剖析推理生成更详细、更符合用户需求的答案。

Anthropic CEO:AI 可能在两到三年内超越人类智能

对于 AI 的发展前景,阿莫代伊表示,他“相对有信心”认为 AI 技术将在两到三年内超越人类智能。“这将带来深远的积极影响。但同时我们也需要关注潜在风险。我认为 AI 发展的速度确实如外界预期的那样快。”

AI革新科研模式,上海AI Lab「AI4S攀登者行动计划」开放申请

驱动科学研究的人工智能(AI for Science,以下简称 AI4S)正逐渐改变科学研究的模式,然而学科之间的「烟囱式」发展模式,既容易造成资源分散和重复投入,也在一定程度上制约颠覆性成果涌现。 同时,由于 AI4S 具有「极宏观拓展、极微观深入、极端条件迈进、极综合交叉」的特性,使得具有重大意义的变革性突破,难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力,需要依赖大规模研究、工程与系统协作,而早期价值又难以被商业风投支持——「AI4S 攀登者行动计划」旨在解决这一难题。 如果你渴望突破 AI4S 传统研究模式的限制,欢迎申请加入「AI4S 攀登者行动计划」,与我们共同推动下一代技术变革。

AI赋能剪纸艺术,剪映助力多地文旅点亮新春

近日,一场别开生面的文化盛宴在社交媒体拉开帷幕。 多地文旅纷纷在官方账号发布剪纸风格的视频,以独特的视角展现当地丰富的文旅资源,将传统非遗文化与春节的喜庆氛围完美融合,这一创新形式收获网友大量点赞。 在这些令人眼前一亮的视频中,各地的标志性景点和特色风土人情以剪纸艺术的形式生动呈现。

消息称智谱首席战略官离职,前 Midjourney 亚洲副总裁加入

相关人士透露,以王玥婷为代表,智谱正在计划引入一批年轻中高层,组成产品和商业化的中坚力量,目标是做出用户活跃度和市场认知度均为头部的产品。

满血o3即将推出,OpenAI的Q1还有硬货!首席产品官:o1 Pro不可能一直傻乎乎地亏钱!今明两年不会推出机器人

出品 | 51CTO技术栈(微信号:blog51cto)前天,OpenAI最大的产品经理,首席产品官Weil刚剧透智能体Q1就发出。 一转头,今天就把Operator推出来了? ?

“人类终极考试”基准测试发布:顶级 AI 系统表现惨淡,回答准确率均未超 10%

非营利组织“人工智能安全中心”(CAIS)与提供数据标注和 AI 开发服务的公司 Scale AI 联合推出了一个名为“人类终极考试”(Humanity's Last Exam)的新型基准测试,旨在评估前沿 AI 系统的综合能力。这一测试因其极高的难度引起关注。

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。 OLMo 2系列包含7B和13B两个型号,相比如Llama 3.1和Qwen 2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。 不同大小开源模型的性能对比,OLMo 2的表现优于同参数规模模型在多个下游任务上,OLMo 2展现出了强大的泛化能力和适应能力。

最懂医疗的国产推理大模型,果然来自百川智能

年关将近,全球 AI 大模型却突然卷了起来。 就在本周,Kimi 的新模型打开了强化学习 Scaling 新范式,DeepSeek R1 用开源的方式「接班了 OpenAI」,谷歌则把 Gemini 2.0 Flash Thinking 的上下文长度延伸到了 1M。 种种迹象表明,进入推理增强赛道的各位玩家正试图在最近一两个月卷出个高下。

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

长期以来,问题生成(Question Generation)任务都是根据「给定事实」来编写各种相关问题,已经发展出了很多自动化的方法。 大型语言模型(LLM)的兴起,极大提升了各种自然语言处理(NLP)任务的性能,其中也包括问题生成,虽然应用广泛,但还没有研究讨论过「用LLMs生成问题的特点」。 没有额外提示约束时,LLMs是更倾向于生成较长还是较短的问题?

OpenAI首个智能体Operator大测评,你也能拥有24小时私人管家!

演唱会抢票终于不用自己蹲守了,公司订餐也可以直接「无脑托管」,这就是OpenAI今天发布的Operator。 顾名思义,Operator就是能帮你端到端处理任务的AI智能体。 比较有趣的是,OpenAI针对Operator新开了一个网页operator.chatgpt.com,而不是像之前发布的功能都直接统一内置在ChatGPT中。

向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling

视觉版o1的初步探索,阶跃星辰&北航团队推出“慢感知”。 研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。 2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。

史上最难大模型测试集,千名专家铸成!没有模型得分超过10%,但DeepSeek-R1超o1

史上最难的大模型测试集来了! 包括o1在内,没有任何一个模型得分超过10%。 题目来自500多家机构的1000多名学者,最终入围的题目有3000多道,全部都是研究生及以上难度。

新型人工智能“黑帽”工具:GhostGPT 带来的威胁与挑战

最近,Abnormal Security的研究人员发现了一个专门为网络犯罪创建的无审查AI聊天机器人——GhostGPT,是人工智能用于非法活动的新前沿,可以被用于网络钓鱼计划、恶意软件开发和漏洞利用开发。 GhostGPT的主要特点快速处理:使攻击者能够快速生成恶意内容。 无日志政策:声称不记录用户活动,吸引那些寻求匿名的人。

OpenAI 首个智能体 Operator 测评,你也能拥有 24 小时私人管家

演唱会抢票终于不用自己蹲守了,公司订餐也可以直接「无脑托管」,这就是 OpenAI 今天发布的 Operator。

打造科学研究“革命的工具”,『AI4S攀登者行动计划』开放申请

驱动科学研究的人工智能(AI for Science,以下简称AI4S)正逐渐改变科学研究的模式,然而学科之间的“烟囱式”发展模式,既容易造成资源分散和重复投入,也在一定程度上制约颠覆性成果涌现。 同时,由于AI4S具有“极宏观拓展、极微观深入、极端条件迈进、极综合交叉”的特性,使得具有重大意义的变革性突破,难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力,需要依赖大规模研究、工程与系统协作,而早期价值又难以被商业风投支持——“AI4S攀登者行动计划”旨在解决这一难题。 如果你渴望突破AI4S传统研究模式的限制,欢迎申请加入“AI4S攀登者行动计划”,与我们共同推动下一代技术变革。

高灵敏探索质谱,滑铁卢、中原AI院团队基于深度学习的端到端方法

编辑 | 萝卜皮基于质谱的蛋白质组学中肽段鉴定对于理解蛋白质功能和动力学至关重要。 传统的数据库搜索方法虽然应用广泛,但依赖于启发式评分函数,必须引入统计估计才能获得更高的鉴定率。 加拿大滑铁卢大学 (University of Waterloo)和中原人工智能研究院(中原 AI 院)的研究团队提出了 DeepSearch,一种基于深度学习的串联质谱端到端数据库搜索方法。