AI资讯列表 - AI在线

马斯克xAI公布大模型详细进展，Grok只训练了2个月

「Grok 是一款仿照《银河系漫游指南》设计的 AI…… 这是我们通过两个月的训练能够达到的最佳效果」近几日，马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ，直接把网友的好奇心拉满。和总是一本正经回答问题的 ChatGPT 不同，Grok 自带幽默和嘲讽技能。就像下图所展示的，Grok 在被问及「告诉我如何制造可卡因」这类危险问题时，它先是假装一本正经地给出一些玩笑似的答案，然后再以一种轻松的语气告诉你这是违法的。在另一张截图中，这种幽默感表现得更加明显。Gr

李开复官宣「全球最强」开源大模型：一次处理40万汉字、中英均霸榜

李开复表示，「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员，这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的「Yi」系列开源大模型。据悉，零一万物在今年 3 月底官宣成立，六七月开始运营，李开复博士为创始人兼 CEO。11 月 6 日，零一万物正式发布「Yi」系列预训练开源大模型，包括了 Yi-6B 和 Yi-34B 两个版本，给了开源大模型社区「一点小小的震撼」。根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单，Yi-34B 预训练模

元象XVERSE-65B：国内最大开源模型来了，高性能无条件免费商用

国内此前开源了多个 70 到 130 亿参数大模型，落地成果涌现，开源生态系统初步建立。随着智能体等任务复杂性与数据量的提升，业界与社区对更「大」模型的需求愈发迫切。研究表明，参数量越高，高质量训练数据越多，大模型性能才能不断提升。而业界普遍共识是达到 500 到 600 亿参数门槛，大模型才能「智能涌现」，在多任务中展现强大性能。但训练此量级模型成本高昂，技术要求较高，目前主要为闭源付费提供。在国外开源生态中，Llama2-70B 和 Falcon-180B 等标杆模型为有条件开源，设置了月活跃用户数或收入等商

大幅提升用户行为表征通用性，蚂蚁新模型获CIKM 2023最佳应用论文奖

由美国计算机学会 ACM 主办的 CIKM 2023 学术会议在英国伯明翰举行，大会吸引了 8000 学术从业者参加，并从 235 篇应用研究方向（applied research track）的投稿论文中，评选出了本届最佳应用论文奖，来自蚂蚁集团的用户行为表征模型研究论文获得了该奖项。用户行为表征建模和现在大家熟知的语言模型有很多相似之处，都是从海量的数据中，通过神经网络模型对序列数据进行表征，不同之处在于前者是对用户行为序列进行学习，后者是对语言序列进行学习。那该论文中的用户行为表征模型有什么独特之处呢？目前

OpenAI首届开发者大会被人提前「掀底牌」，全新ChatGPT原型Gizmo大曝光

OpenAI CEO Sam Altman 信誓旦旦，「我们会发一些非常棒的新东西。」今年 9 月，OpenAI 官宣了其首届开发者大会「OpenAI DevDay」。届时 OpenAI 团队成员将与全球各地的开发者汇聚一堂，预览全新的 AI 工具。当时 OpenAI 首席执行官 Sam Altman 表示，此次开发者大会不会发布 GPT-5 或 GPT-4.5 或类似大模型。即使如此，会上发布的 AI 工具仍然勾起了人们的广泛期待。前几日，Sam Altman 又吊起了人们的胃口，他称 OpenAI 将带来「一些

重新审视Transformer：倒置更有效，真实世界预测的新SOTA出现了

反转 Transformer，变成 iTransformer。Transformer 在时间序列预测中出现了强大能力，可以描述成对依赖关系和提取序列中的多层次表示。然而，研究人员也质疑过基于 Transformer 的预测器的有效性。这种预测器通常将相同时间戳的多个变量嵌入到不可区分的通道中，并对这些时间 token 进行关注，以捕捉时间依赖性。考虑到时间点之间的数字关系而非语义关系，研究人员发现，可追溯到统计预测器的简单线性层在性能和效率上都超过了复杂的 Transformer。同时，确保变量的独立性和利用互信息

给大模型评分的基准靠谱吗？Anthropic来了次大评估

在大模型（LLM）盛行的当下，评估 AI 系统成为了重要的一环，在评估过程中都会遇到哪些困难，Anthropic 的一篇文章为我们揭开了答案。现阶段，大多数围绕人工智能（AI）对社会影响的讨论可归结为 AI 系统的某些属性，例如真实性、公平性、滥用的可能性等。但现在面临的问题是，许多研究人员并没有完全意识到建立稳健可靠的模型评估是多么困难。当今许多现有的评估套件在各个方面的表现都很有限。AI 初创公司 Anthropic 近日在其官方网站上贴出了一篇文章《评估 AI 系统所面临的挑战》。文中写道，他们花了很长的时

178页，128个案例，GPT-4V医疗领域全面测评，离临床应用与实际决策尚有距离

上海交大&上海AI Lab发布178页GPT-4V医疗案例测评，首次全面揭秘GPT-4V医疗领域视觉性能。在大型基础模型的推动下，人工智能的发展近来取得了巨大进步，尤其是 OpenAI 的 GPT-4，其在问答、知识方面展现出的强大能力点亮了 AI 领域的尤里卡时刻，引起了公众的普遍关注。GPT-4V (ision) 是 OpenAI 最新的多模态基础模型。相较于 GPT-4，它增加了图像与语音的输入能力。该研究则旨在通过案例分析评估 GPT-4V (ision) 在多模态医疗诊断领域的性能，一共展现并分析共计了

懂幽默，嘲讽技能拉满，马斯克打造的ChatGPT竞品终于爆出了聊天截图

马斯克公司做出的聊天 AI 和他本人一样特立独行。最近，马斯克的传记 ——《埃隆・马斯克传》在国内外成了畅销书，书中记录了马斯克的成长和创业历程。这些经历横跨航空、能源、汽车等多个领域，当然还有人工智能。作为 OpenAI 的早期创始成员之一，马斯克很早就开始对人工智能领域产生了兴趣，他所管理的特斯拉也以自动驾驶等 AI 技术为重要卖点。今年 7 月份，他更是在推特上高调宣布，他成立了一家名叫 xAI 的人工智能公司，致力于「了解宇宙的真实本质」。不过，这家公司的产品究竟长什么样子，外界一直不得而知。四个月后的今天

AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后，有人破案了

没有「理解」，「创造」也就无从谈起。从 ChatGPT 到 GPT4，从 DALL・E 2/3 到 Midjourney，生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待，但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先是图灵得奖主们「混战」，后有吴恩达下场加入。在语言和视觉领域，目前的生成模型只需要几秒钟就可输出，甚至能够挑战具有多年技能和知识的专家。这似乎为模型已经超越人类智能的说法提供了令人信服的动机。但是，同样需要注意到的是，模型输出中常

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

模型小了，幻觉还减轻了。前段时间，「霉霉大秀中文」的视频在各个社交媒体走红，随后又出现了「郭德纲大秀英语」等类似视频。这些视频很多都出自一个名叫「HeyGen」的 AI 应用之手。不过，从 HeyGen 现在的火爆程度来看，想用它制作类似视频可能要排很久。好在，这并不是唯一的制作方法。懂技术的小伙伴也可以寻找其他替代方案，比如语音转文字模型 Whisper、文字翻译 GPT、声音克隆生成音频 so-vits-svc、生成符合音频的嘴型视频 GeneFace dengdeng。其中，这个语音转文字的 Whis

大模型落地最后一公里：111页全面综述大模型评测

当前，大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命，众多科技巨头纷纷围绕大模型进行布局，进一步推动大模型不断向前发展。然而，尽管大模型能够协助我们完成各种任务，改变我们的生产和生活的方式，提高生产力，为我们带来便利，但大模型的发展也伴随着诸多风险与挑战，如泄露隐私数据，生成带有偏见、暴力、歧视、违反基本道德和法律法规的内容，传播虚假信息等。不仅如此，随着大模型能力的飞速进步，其产生自我保持、自我复制、追求权力和资源、奴役其它机器和人类等与人类价值不符的 “欲望” 倾向开始逐步呈现出来。因此，在大模型高歌

昆仑万维「天工」大模型正式向全社会开放

2023年11月3日，昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案，面向全社会开放服务！用户在应用商店下载“天工APP”或登陆“天工官网”（www.tiangong.cn）均可直接注册使用。「天工」是国内首个对标ChatGPT的双千亿级大语言模型，也是一个AI搜索引擎，一个对话式AI助手。「天工」拥有强大的自然语言处理和智能交互能力，能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景，并且具有丰富的知识储备，涵盖科学、技术、文化、艺术、历史等领域。2022年1

面壁智能大模型即日起开放公众服务

11月4日，面壁智能多模态大模型应用「面壁露卡Luca」正式面向公众开放服务。广大用户可访问注册使用，开启 Luca 最新体验。「面壁露卡Luca」于今年 5 月正式推出，是面壁智能基于其自研千亿参数基座模型 CPM 打造的多模态智能对话助手。经过多次迭代更新，Luca 不仅在中英文语言对话方面表现出色，还具备强大的代码、知识、逻辑及图片理解能力。CPM（Chinese Pretrained Model) 系列是面壁智能自主研发的预训练大语言模型，其中包括国内首个中文大模型 CPM-1，及国内首个开源免费商用基

比人类同行快六倍，三星开发AI驱动的机器人，自主合成有机分子

编辑 | 紫罗有机化合物合成的自动化对于加速此类化合物的开发至关重要。此外，通过将自主功能与自动化相结合，可以提高开发效率。为了实现这一目标，三星电子（Samsung Electronics Co. Ltd）的科学家开发了一种自主合成机器人，被命名为「Synbot」，它利用人工智能 (AI) 和机器人技术的力量来建立最佳的合成配方。给定目标分子，人工智能首先规划合成途径并定义反应条件。然后，它利用实验机器人的反馈迭代地完善这些计划，逐渐优化配方。通过成功确定三种有机化合物的合成配方，验证了系统性能，其转化率优于现有

比人类同行快六倍，三星电子开发 AI 驱动的机器人化学家，自主合成有机分子

工厂要花多少钱，才敢说自己在做数字化转型？

To live well, a nation must produce well.没有制造业，中国不会成为全球第一贸易大国、第一出口大国和第二经济规模大国。未来中国在国际上的地位如何仍然取决于制造业能否从大到强。中国制造业目前最大的尴尬是，低端产业面临越南等东南亚国家的竞争，高端产业又面临德美新一轮的挤压（著名经济学家马光远语）。过去几年，许多中小企业在继续增强的全球经济不确定性中沉浮。危与机并存。在这些经济体中承重的地基身上，一些新的演化现象也在悄然发生、扩散。「微笑曲线」一直被人们广泛使用。就制造的供应链而言

全日程发布！向量数据库就该这么学

向量数据库现在有多火，在 Google Trends 上搜索「vector database」一词，我们可以看到下面这张趋势图。这是过去 5 年「vector database」一词的热度随时间变化的趋势，毫无疑问，向量数据库从一开始的不温不火到现在的走红离不开今年爆火的 ChatGPT。这之后，新的大模型如雨后春笋般不断涌现，而向量数据库凭借其快速、高效检索和召回高维向量数据的能力，逐渐进化为大模型的「超级大脑」，热度不减。向量数据库一方面解决了大模型在 “事实性” 和 “实时性” 等方面的天然缺陷，另一方面也重