应用

顶会卷到中学：人大附中吴悠上榜 NeurIPS，入选高中赛道 Spotlight

NeurIPS 2024 放榜，人大附中有高中生一作入选。今年，NeurIPS 率先把 AI 顶会卷到了高中里，正式面向高中生征集论文，还为此专门设置了高中生赛道（High School Projects Track）。现在结果终于出炉，北京大学计算机学院的张铭教授分享了一则入围消息：人大附中吴悠，有一篇一作论文入选该赛道，还被选为了 Spotlight Project。论文题为《Vision-Braille：An End-to-End Tool for Chinese Braille Image-to-Text

9/29/2024 12:45:39 PM

汪淼

最受欢迎开源大模型，为什么是通义？

开源与闭源之争早已非新奇的话题，但毋庸置疑的是，开源极大地促进了大模型技术发展和生态繁荣。大模型被认为是最烧钱的技术，训练一个大模型往往需要大量的数据、计算资源，导致训练成本巨大，众所周知GPT-3的训练费用据说超过 4600万美元，在大模型开源之前，大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮，那些没有AI积累的企业、大量中小公司团队，今天个人开发者，都能基于开源底座模型，用很低的成本训练、部署自己的专属模型，llama 这样的开源先锋也因此拥有一众拥趸。

9/29/2024 11:15:00 AM

张进

用一篇文章，帮你掌握 Midjourney 的人物风格迁移功能！

大家好，这里是 BananaStudio，上一篇介绍了如何用提示词描述画面中的多个人物，其中提到了 cref，今天详细带大家搞清楚 MJ 人物风格化迁移功能 Character Reference，也就是—cref 命令。如何仿照目标图来生成一样的图？现在 MJ 中有三种方式可以达成： ① 垫图（最常用的手法）将构图、主题和一些风格大致应用到你生图中。操作说明：参考图片需要上传到 Discord，复制图片的 URL 添加到提示词中。在随后的生图中将会参照你写的提示词和参考垫图中的信息，通过添加“--iw”（图片权

9/29/2024 8:24:22 AM

BananaStudio

国际机器人联合会：2023 年我国新安装工业机器人 27.63 万台，超全球半数

综合新华社、央视财经今日报道，总部位于德国法兰克福的国际机器人联合会报告显示，2023 年，中国新安装的工业机器人数量达到 27.63 万台，占全球新安装量的 51%。总量上，我国 2023 年工业机器人总保有量为近 180 万台，位居全球第一，并将继续保持全球最大工业机器人市场的地位，今年下半年中国机器人市场也将加速扩大。从长远来看，中国制造业领域对机器人需求仍有很大增长潜力，预计到 2027 年，年均增长率将达到 5% 至 10%。全球 2023 年工业机器人总保有量约 428.2 万台，比前一年增加 10%。

9/28/2024 9:52:24 PM

清源

苏黎世联邦理工学院研究：AI 可 100% 绕过谷歌 reCAPTCHA V2 验证

据 Ars Technica 今日报道，苏黎世联邦理工学院博士生 Andreas Plesner 及其同事发表了一项新研究，研究重点放在了谷歌的验证码系统 reCAPTCHA V2 上。该研究声称，使用经过专门训练的图像识别模型运行的本地机器人在应对这类图片验证码时的表现，可以与人类相媲美，成功率达到了 100%。AI在线注：谷歌 reCAPTCHA V2 验证码通常会向用户提供一组图片，要求识别出图中的哪些部分包含自行车、巴士、人行道、楼梯或红绿灯等项目。根据谷歌的说法，该系统已在几年前逐步进入淘汰阶段，新的 r

9/28/2024 7:37:45 PM

清源

中国电信 AI 研究院完成首个全国产化万卡万参大模型训练，TeleChat2-115B 对外开源

“中国电信人工智能研究院”官方公众号今天宣布，中国电信人工智能研究院（AI在线注：下文称 TeleAI）成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型，并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。官方表示，这项科研成果标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成

9/28/2024 6:38:22 PM

清源

美 FTC 宣布将打击“虚假宣传 AI 能力”公司，首批起诉五家企业

美国联邦贸易委员会（FTC）在 9 月 25 日宣布将向虚假宣传 AI 技术或销售劣质 AI 技术的公司展开法律行动，首批被 FTC 起诉的五家公司包括 DoNotPay、Ascend Ecom、Ecommerce Empire Builders、Rytr 和 FBA Machine。据悉，其中 DoNotPay 提供机器人律师服务，该 AI 主力由斯坦福大学学生 Joshua Browder 于 2016 年推出，号称能够替代人类律师，季订阅费为 36 美元（AI在线备注：当前约 252 元人民币）。▲ DoNo

9/28/2024 5:00:05 PM

漾仔

OpenAI：计划五年内将 ChatGPT 每月订阅费用提高到最高 44 美元

感谢据 Engadget 当地时间 27 日报道，OpenAI 告诉投资者，该公司计划在今年年底前收取 ChatGPT 每月 22 美元（IT 之家备注：当前约 154 元人民币）的费用，并计划在未来五年内积极提高月费，最高将提升至 44 美元（当前约 308 元人民币）。图源 Pexels报道提到，OpenAI 正在从非营利公司向盈利公司的转变迈步，这种商业模式可取消对投资者汇报的任何上限，因此公司将有更大的空间以潜在的更高价格与新投资者谈判。文件显示，OpenAI 今年 8 月的营收为 3 亿美元（当前约 21

9/28/2024 4:18:47 PM

清源

工信部：截至 2024 年 6 月底，我国算力总规模达 246EFLOPS

2024 中国算力大会“算力中国・创投活力”论坛昨日在郑州召开。作为以算力为主题的大会，工业和信息化部信息通信发展司副司长赵策在论坛上介绍了我国算力运营和使用的最新情况，AI在线整理如下（截至 2024 年 6 月底）：我国在用数据中心机架数达到 830 万标准机架，算力总规模达到 246EFLOPS（2460 万亿次浮点运算）智能算力规模超过 76EFLOPS算力应用创新案例超过 13000 个，覆盖工业、金融、交通等生产生活领域人工智能企业数量超过 4500 家工业和信息化部总工程师赵志国表示，互联互通纵深推进

9/28/2024 3:25:32 PM

沛霖（实习）

Science 子刊封面：500 年前拉斐尔怎么作画，AI 看一眼就知道

AI 的跨界，只有想不到，没有办不到。艺术学家们用深度学习模型分析拉斐尔的画作，不仅能分析出用了什么颜料、怎么画的，还能知道 500 年前拿着画笔的是不是拉斐尔本人。DALL-E、MidJourney 等工具的诞生，让我们看到了 GenAI 高超的「创作技能」。但如果反过来，让 AI 去分析艺术大师的画作，它们又会有怎样的表现？最近，Science Advances 封面刊登了一篇来自意大利文化遗产科学研究所的论文。他们将两幅著名的拉斐尔画作进行了 MA-XRF 扫描，并使用深度学习模型进行分析。结果发现，AI 不

9/28/2024 3:21:09 PM

清源

o1 规划能力首测：已超越语言模型范畴，preview 终于赢 mini 一回

o1-preview 终于赢过了 mini 一次！亚利桑那州立大学的最新研究表明，o1-preview 在规划任务上，表现显著优于 o1-mini。相比于传统模型的优势更是碾压级别，在超难任务上的准确率比 Llama3.1-405B 高了 11 倍。要知道之前，OpenAI 自己人也发了一张图，显示 preview 论性能比不过满血版，论经济性又不如 mini，处于一个十分尴尬的地位。作者在推文中表示，尽管存在可保证性和成本问题，但仅针对 CoT 而言，o1 已经超越了大模型的“近似检索”性质，提升到了“近似推理”

9/28/2024 3:09:17 PM

清源

三星预言 2025 年将掀起 AI 普及浪潮，重塑消费者日常生活方式

科技媒体 techradar 今天（9 月 28 日）发布博文，报道称三星 Galaxy AI 项目负责人 YoungJip Kim 表示：“2025 年将是 AI 普及元年，未来 AI 将出现在生活的每个角落”。Kim 在采访中表示：“消费者对于 AI 技术的期望不断拔高，而大多数科技公司都在这方面非常努力。AI 技术的蓬勃发展，将会进一步扩充聊天互动之外的方式，用更多元化的方式、更先进的技术变革我们的日常生活”。他举了例子说明即使是最普通的 AI 应用也能改变生活，如 AI 翻译功能消除了语言障碍。AI在线援引

9/28/2024 2:48:44 PM

故渊

苹果反水：OpenAI的1500亿「史上最大」融资轮，难了

有金主已经决定收手。在 OpenAI，高层变动正在成为一种传统。在不到两年的时间里，OpenAI 从一个 AI 圈内领先的实验室，发展成为一家全球知名的企业。在首席执行官山姆・奥特曼（Sam Altman）被罢免并迅速复职不到一年后，今年 9 月，三位高层领导突然宣布辞职。一个摆在台面上的问题是：这次宫斗的时间点，就在 OpenAI 即将完成可能是硅谷史上最大一轮融资的同一周。本周，OpenAI 首席技术官 Mira Murati、首席研究官 Bob McGrew 和 Post Training 研究副总裁 Bar

9/28/2024 2:26:00 PM

机器之心

长短大小样样精通！原始分辨率、超长视频输入：更灵活的全开源多模态架构Oryx

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文的主要作者来自清华大学智能视觉实验室（i-Vision Group）、腾讯公司和南洋理工大学 S-Lab。本文的共同第一作者为清华大学自动化系博士生刘祖炎和南洋理工大学博士生董宇昊，主

9/28/2024 1:59:00 PM

机器之心

Voyage-3 系列嵌入式 AI 模型登场：1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%

科技媒体 marktechpost 昨日（9 月 27 日）发布博文，报道称 Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式（Embedding）模型。这两个模型在技术、法律、金融、多语言应用和长文本理解等方面，均表现出超出同类模型的优势，在保持较小模型规模和较低的资源消耗情况下，为开发者提供更高效、更易于集成的解决方案。AI在线援引 Voyage AI 官方数据，在技术文档、代码、法律、金融、网页内容、多语言数据集、长文档和对话数据等方面，Voyage-3 以 1/2

9/28/2024 1:55:54 PM

故渊

微软被曝拓展 Copilot AI 应用，打造专属于你的新闻主播

科技媒体 Windows Central 昨日（9 月 27 日）报道，微软公司正计划扩展 Copilot，打造个性化的虚拟新闻主播，播报用户感兴趣的相关新闻和动态信息。消息称微软在文生图和网络搜索之外，积极推动各项 AI 服务落地。AI在线曾于 9 月 21 日报道，微软启动第二波 Copilot 更新，引入了全新的 Pages，为 Excel 支持 Python 语言，以及上线 Copilot Agents 等。微软计划重塑移动端 Copilot 应用程序，将常规的 AI 助手转变为虚拟新闻主播，目前微软已经

9/28/2024 12:41:26 PM

故渊

微软网页版 OneDrive 正式融合 Copilot：一键总结、多文件对比，AI 提高你的生产力

微软公司昨日（9 月 27 日）发布新闻稿，宣布面向获得 Copilot 许可的商业用户，正式开放网页版 OneDrive 中的 Copilot，意味着用户可以探索全新的 AI 文件处理方式。OneDrive 中的 Copilot 的技能包括：为大文件生成摘要Copilot 能够为用户生成文档摘要，节省查找关键点的时间，并帮助用户专注于最重要的内容。对比多个文档中的差异用户无需打开文件，Copilot 可以比较多个文档的差异，快速展示关键差异。回答文件内容相关话题Copilot 能够分析 OneDrive 中的文件

9/28/2024 12:29:13 PM

故渊

腾讯、同济大学达成合作：共建“大设计大模型行动”，上线大学教授 AI 智能体

感谢AI在线从腾讯官方获悉，在今天举行的 2024 年世界设计之都大会上，腾讯和同济大学宣布达成一项合作，双方将结合腾讯混元大模型能力，与同济大学在大设计学科的优势和影响力，共建“同济-腾讯大设计大模型行动（TT）”。该行动的目的，是打造设计领域首个拉通学科和产业全链路的设计大模型生态；连接设计院校、专家、产业和消费者；助力实现大规模、个性化的教学科研与产业创新。双方合作的初步尝试是“大学教授 AI 智能体”Prof.Lou，其能够回答各种设计相关的专业问题。据介绍，Prof. Lou 收集了娄教授公开发表的著作、

9/27/2024 11:18:39 PM

清源

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI