AI资讯列表 - AI在线

ChatGPT上新文件分析、自动搜索等功能，初创公司的产品被取代？

OpenAI 已然算是创业公司中的「巨头」。最近，OpenAI 为 ChatGPT Plus 会员推出了新的测试版功能，主要包括上传和分析文件，支持多模态，并且系统会根据上下文自动选择是否使用必应浏览器、数据分析工具、DALL·E，而无需用户手动切换。将文件输入到 ChatGPT 后，系统需要一些时间来消化该文件，然后 ChatGPT 就可以执行汇总数据、回答问题或根据 prompt 生成数据可视化等操作。目前，已有一些 ChatGPT Plus 会员用户测试了这些新功能。例如，有网友上传了图像文件，使用 Chat

像搭乐高一样做数学定理证明题，GPT-3.5证明成功率达新SOTA

中山大学和华为等机构的研究者提出了 LEGO-Prover，实现了数学定理的生成、整理、储存、检索和复用的全流程闭环。背景作为长链条严格推理的典范，数学推理被认为是衡量语言模型推理能力的重要基准，GSM8K 和 MATH 等数学文字问题（math word problem）数据集被广泛应用于语言模型的测评和比较中。事实上，数学作为一项科学研究并不仅仅包括计算具体实例，还包括推演一般性的定理。不同于简单的计算问题仅仅需要验证最终的结果与答案是否匹配，定理的证明要求对数学概念拥有更严格的理解，而这种定理证明的正确性是难

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

最近，AI 领域都在思考一件事：多模态大模型落地产业，好的打法应该是什么？通用人工智能时代正在到来，AI 大模型技术已成为数字经济下基础设施建设的重要支撑，也成为产业智能化转型的核心「引擎」，AI 大模型产业应用迎来了前所未有的发展机遇。在 10 月 28 日举办的 CNCC 2023「超智融合 AI 大模型应用落地发展论坛」上，智子引擎发布了「元乘象 Chatimg3.0」，展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。Chatimg3.0 核心技术的升级迭代元乘象 Chat

比Transformer更好，无Attention、MLPs的BERT、GPT反而更强了

本文探索了 Monarch Mixer (M2) ，这是一种在序列长度和模型维度上都是次二次的新架构，并且在现代加速器上具有很高的硬件效率。从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型，Transformer 正以锐不可当之势席卷这个世界，但人们也不禁会问：Transformer 是唯一选择吗？斯坦福大学和纽约州立大学布法罗分校的一个研究团队不仅为这一问题给出了否定答案，而且还提出了一种新的替代技术：Monarch Mixer。近日，该团队在 ar

用50多年时间，探索最令人困惑的复杂性理论知识极限

证明问题难以解决究竟有多难？元复杂性（meta-complexity）理论研究者数十年来一直探究这个问题。近期的一系列研究成果开始给出这个问题的答案。复杂性理论研究者正直面着最让人困惑的问题：复杂性理论本身。一、起源2007 年秋季学期的第一周，Marco Carmosino 拖着自己去上了一堂数学课，这是马萨诸塞大学阿默斯特分校计算机科学专业学生的必修课。Carmosino 是一位大二学生，他当时正在考虑退学去设计视频游戏游戏。上课的教授提出了一个简单的问题，而这个问题将改变他的人生轨迹：你怎么知道数学真的有用？

昆仑万维开源「天工」13B系列大模型，0门槛商用

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Math模型，它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果，其中文能力尤为出色，在中文科技、金融、政务等领域表现均高于其他开源模型。Skywork-13B下载地址（Model Sc

更高清写实的人体生成模型HyperHuman来了，基于隐式结构扩散，刷新多项SOTA

论文地址: 地址: . 研究背景与动机随着扩散模型的兴起，一些典型的模型例如 Stable Diffusion, DALL-E 2 等在文本生成图像任务上展现了令人震撼的能力。但一个明显的不足是，这些模型在文本生成人体图片的任务上表现得不尽如人意，甚至很难生成具有合理结构或自然姿态的人体（例如正确的四肢数目和符合人体物理结构的几何拓扑）。背后的主要原因在于：自然环境下的人体是铰接的，且包含刚性和非刚性的形变；生成高质量的人体图片需要文本难以描述的结构信息。为了在文生图中引入结构控制信息，近期的代表工作如 Cont

国内唯一全面对标OpenAI的创业公司，大模型已经出到第三代

中国大模型公司，正在进入竞争的新阶段。仅用六个月时间，国内 AI 创业公司就已经把大语言模型发展到了第三代。10 月 27 日，中国计算机大会 CNCC2023 上，智谱 AI 发布了自研第三代对话大模型 ChatGLM3。这是继 6 月 25 日发布 ChatGLM2 后，智谱 AI 对话大模型的又一次重大升级。智谱 AI CEO 张鹏在活动中进行了演讲。「ChatGLM3 融入了我们的一系列最新研究成果，实现了包括跨模态、Agent 等一系列全新能力

谷歌20亿美元砸向Anthropic：大模型军备竞赛升级

Anthropic 一年就收获了近 70 亿美元的投资。据华尔街日报、路透社等媒体报道，Alphabet 旗下谷歌公司发言人本周五表示，该公司已同意向人工智能公司 Anthropic 投资至多 20 亿美元（约合 146 亿人民币）。该发言人表示，该公司已向这个 OpenAI 的重要竞争对手预先投资 5 亿美元，并同意在此之后追加 15 亿美元。此前，谷歌已经是 Anthropic 的重要投资者，随着大型科技公司竞相将人工智能融入到自身业务中，这项新的投资将帮助谷歌加大力度与微软进行持续竞争。Anthropic 是

多模态搜索算法如何让视频搜索更精准？腾讯独家揭秘，超详细

一文详解多模态技术在 QQ 浏览器视频搜索上的实践经验。引言视频搜索作为搜索中最大的横向垂类，在约 50% 的搜索词下都会有视频结果的展现。然而，视频资源又不同于文本网页资源，在视频理解、视频匹配排序，以及交互行为等方面都会带来新的技术挑战。多模态技术近年逐步走进人们的视野，特别是 Transformer 结构在 NLP 领域的大放异彩后，也向视觉、音频等多模态领域延伸，为跨模态融合带来更大的便利和可能。多模态预训练（比如 ViLBERT/VisualBERT/VL-BERT/ERNIE-ViL 等）、多模态融合技

小模型如何比肩大模型，北理工发布明德大模型MindLLM，小模型潜力巨大

北京理工大学发布双语轻量级语言模型，明德大模型—MindLLM。大型语言模型 (LLMs) 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更好地服务特定领域，减少下游任务的训练与推理成本。10 月 24 日，北京理工大学自然语言处理团队发布系列双语轻量级大语言模型明德 (Ming De LLM)——MindLLM，全面介绍了大型模型开发过

每人10万元，这13位青年人才获得2023年度字节跳动奖学金

一年一度，字节跳动奖学金计划「开奖」了。2023 年 5 月，第三届「字节跳动奖学金计划」正式发起，吸引了来自数十所高校、数百位国内优秀青年学子的报名申请。经过专家团队的初审、复审、终审等层层考核，共有 13 位同学凭借着卓越的学术成果和优异的个人实践，每人荣获 10 万奖学金。今年的获奖者来自北京大学、复旦大学、清华大学、上海交通大学、香港科技大学、浙江大学、中国科学技术大学（按学校拼音首字母排序）这 7 所国内高校，研究领域涉及机器学习、生成式模型、自然语言处理、智能媒体数据生成与编码等当前热门技术领域。他们之

波士顿动力机器狗装上ChatGPT大脑当导游，一开口就是老伦敦腔

我们看过机器狗攀爬、跳跃、跑酷、开门，但现在，它竟然开口说话了。「可以开始我们的旅程了吗？」Spot 礼貌地发出询问：「请跟我来，先生们！」在一段最新发布的视频里，波士顿动力展示了将机器狗与 LLM 集成的成果：「Spot 先生」戴着高礼帽，留着小胡子，有着大眼睛和英国口音，正带人参观公司的设施。为了让 Spot 能够「开口」，波士顿动力公司使用 OpenAI 的 ChatGPT API 以及一些开源 LLM 来训练，然后为机器人配备了扬声器，添加了文本到语音转换的功能。所以你能看到，在发出声音的同时，Spot 不

小米14发布：搭载全新澎湃OS，Pro版用上钛金属

小米战略升级至「人车家全生态」，澎湃 OS 正式上线，还有特别的内存扩容技术。今年的安卓旗舰手机，比往年来得要更早一些。双十一还没到，10 月 26 日晚的发布会上，小米 14 系列手机就正式发布了。在发布会上，雷军宣布了小米集团的全新战略升级：从「手机 X AIoT」，升级到了「人车家全生态」。小米计划从个人设备到智能家居，再到智能出行，打造以人为中心，构建起「人车家全生态」的智能世界。与此同时，小米发布了新一代操作系统、数字高端旗舰小米 14 系列，以及 Xiaomi Watch S3、小米电视 S Pro 8

想把图像变成动图/视频？这5款AI神器帮你轻松搞定！

大家好，这里是你们的 AI 神器挖掘机花生~ 今天为大家推荐 5 款可以将图像转换为动图或者短视频的 AI 神器，它们都是在线工具，操作简单还可以免费使用，可以让静态图像更具吸引力，适合用来生成动态海报或创意短视频~ 上期回顾：一、LeiaPix Converter 网站直达：（登录后使用） LeiaPix Converter 是一个免费将图片转换为 3D 伪深度动图的工具，操作简单方便，可以自定义动画范围、深度、时长、运动方式、动态强弱，图像可以保存为 MP4 /GIF 等多种格式。使用方法：进入网站后，先注

如何用Stable Diffusion 把黑白老照片变成彩色高清图？教程来了！

在这个时代，我们习惯于拥有高清、色彩丰富的照片，然而，那些古老的黑白色老照片由于年代的久远，往往会出现模糊、破损等现象。那么今天要给大家介绍的是，用 Stable Diffusion 来修复老照片。前段时间 ControlNet 的除了上线了“IP-Adapter”模型以外还增加另一个叫“Recolor”的模型，它的作用就是给图片重新上色。通过“Recolor”，我们能够让那些古老的黑白色老照片重现生机，展现出它们原本应有的色彩和细节。更多SD教程：一、插件以及模型下载本文需要用到的插件、脚本以及模型如下：

更低计算成本，基于单电子约化密度矩阵的机器学习电子结构方法

编辑 | 萝卜皮密度泛函理论（DFT）的定理建立了多体系统的局部外部势与其电子密度、波函数以及单粒子约化密度矩阵之间的双射映射。在此基础上，罗格斯大学（Rutgers University）和纽约大学（New York University）的研究人员证明基于单电子约化密度矩阵（reduced density matrices）的机器学习模型可用于生成替代电子结构方法。该团队为从小分子（如水）到更复杂的化合物（如苯和丙醇）的系统生成局部和混合 DFT、Hartree-Fock 和完整构型相互作用理论的替代品。代理模

机器会说话 | 李学龙团队建立无人机“聊天群”

在线群聊极大地方便了人们的沟通方式，能否把机器也拉进群，让它们组团商量着干活，并和人类无障碍地沟通和交流，更好地服务于生产生活？