资讯列表
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
官方表示:Janus 的表现超越了传统的统一模型,并且在与任务特定模型的比较中也同样表现出色。凭借其简洁、高灵活性和高效性的特点,Janus-Pro 成为下一代统一多模态模型的有力竞争者。
DeepSeek:近期线上服务被大规模恶意攻击导致注册可能繁忙,已注册用户可正常登录
DeepSeek通过官方服务状态发布声明称:近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。
不止科技股,欧美能源股同样遭到了来自 DeepSeek 的“重创”
尽管周一出现了大规模抛售,彭博情报的分析师 Omid Vaziri 认为,西门子能源、施耐德电气和勒格朗等公司的需求增长不太可能受到影响。他指出,DeepSeek 的AI模型可能会加速用户对人工智能的采纳。
出人意料:研究发现对 AI 了解越少的人越愿意使用 AI
人工智能(AI)的快速发展引发人们的思考:究竟哪些人最有可能在日常生活中拥抱 AI?许多人认为,精通技术、了解 AI 运作原理的人群无疑是 AI 最热情的拥趸。然而,一项发表在《营销学期刊》(Journal of Marketing)上的最新研究却得出了令人惊讶的结论:对 AI 了解较少的人反而更乐于使用这项技术。研究人员将这种接受倾向的差异称为“低认知-高接受度”关联。
DeepSeek 再次宕机:无法回答问题
多位网友反映,人工智能平台 DeepSeek 出现运行故障,目前无法正常响应用户提出的对话问题,并显示“当前操作暂时无法完成,如需帮助,请联系我们”的提示信息。同时,用户登录界面也显示“登录失败”的提示,用户无法正常登录该平台。
Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
执行推理时能对齐语言模型吗?谷歌InfAlign带来一种对齐新思路
在根据某个奖励微调生成式语言模型时,使用 KL 正则化的强化学习(KL-RL)来对齐生成式语言模型是一种常用框架。 而 KL-RL 通常需要训练一个奖励模型,然后使用一个强化学习求解器。 其它方法还包括直接偏好优化、奖励模型蒸馏、best-of-N 蒸馏的不同变体版本。
让大模型互联网「冲浪」,通义实验室WebWalker解锁复杂信息检索新技能
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
微软 CEO 纳德拉评 DeepSeek:令人印象深刻,计算效率非常高
“DeepSeek的新模型令人印象深刻,尤其是在如何高效开发开源模型并进行推理计算方面,它的计算效率非常出色。我们应当非常认真地对待来自中国的这些技术进展。”
验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法
图 1:研究概念图。 编辑 | ScienceAI随着全球对可再生能源需求的日益增长,电池作为储能系统关键技术的地位愈发凸显。 然而,电池研发过程中面临着从材料原型到商业产品转化的重重挑战,电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。
DARWIN 1.5 来啦!材料设计通用大语言模型,刷新多项实验性质预测记录
编辑丨Science AI材料发现和设计的核心目标是寻找理想的成分和结构,但传统方法,如高通量模拟和机器学习,通常依赖于复杂描述符,过于固定且难以通用,并且无法准确反映真实材料特性,因而限制了实际应用。 GreenDynamic 与来自澳大利亚新南威尔士大学(UNSW),上海人工智能实验室和香港城市大学的团队共同开发了一款名为 DARWIN 1.5 的模型。 不同于传统机器学习方法,DARWIN 基于语言接口微调框架(LIFT,2022 NeurIPS, 本文共同作者),整合了 33 万科学问答和 22 个材料科学任务,为材料属性预测和发现提供了灵活统一的预训练模型,并且成功精准预测了上万种材料的性质数值。
披头士成员保罗・麦卡特尼喊话英国政府:莫让 AI 威胁艺术家生计
麦卡特尼表示,创作和音乐曾是他和伙伴们找到的既能满足热情又能养活自己的职业,而政府的提案却可能剥夺艺术家的创作动力,导致“创意的丧失”。
DeepSeek 引发全球科技股震荡,英伟达高估值遭质疑
据彭博社报道,中国人工智能初创公司 DeepSeek 本周一引发了全球科技股的震荡,其最新发布的 AI 模型因其成本效益高且能在较低端芯片上运行,引发了市场对英伟达等公司高估值的质疑。英伟达的芯片一直被视为 AI 技术发展的核心驱动力,并推动了全球 AI 股票的繁荣。
优必选计划年底前大规模生产人形机器人,全年将交付 500-1000 台
优必选的首席品牌官Michael Tam在接受采访时透露,今年该公司将向客户和合作伙伴交付500到1000台Walker S系列工业人形机器人,客户包括富士康及顺丰等。
DeepSeek 多岗位招人,实习生日薪最高达上千元
据红星资本局报道,深度求索公司的北京子公司目前正在招聘 52 个岗位,涵盖深度学习研究员、核心系统研发工程师及资深 UI 设计师等职位,均为 14 薪。其中,核心系统研发工程师(校招)的薪资范围为 6 万元至 9 万元,大部分岗位的起薪在 2 万元以上。公司还提供高薪实习机会,AGI 大模型实习生的日薪为 500 元至 1000 元,数据百晓生实习生为 500 元 / 天-510 元 / 天。
消息称 Meta 成立 4 个小组研究 DeepSeek,基于此来改进自家 Llama
据 Information 网站,Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。
闲来无事,我测了测国产大模型的RAG能力 新智元 新智元 2025年01月27日 12:25 北京
最近,AI界被推理模型刷屏了。 国内各家的推理模型,在新年到来之际不断刷新我们的认知。 不过,当我们在实际应用中考量大模型,衡量好不好用的标准,就绝不仅仅局限于其性能和规模了。
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
2025年主导AI的将是第3代scaling law:测试时计算。 正如Michael Dell转述所言:第一代scaling:预训练像读大学第二代scaling:微调像读博士第三代scaling:测试时计算就像深度思考和推理近日,计算机强校CMU机器学习系,发表博客文章解释LLM测试时计算优化问题,特别是涉及到的元强化学习(meta-RL)问题。 文章亮点如下:监督学习只是在训练模型「答案是什么」,只要学习「如何解答」,模型泛化性会更好。