文本

科大讯飞智文 2.0 版本发布：内置 AI PPT 编排创作引擎，基于星火大模型

AI在线从讯飞开放平台获悉，讯飞智文 2.0 版本今天正式发布，带来 PPT 文本生成大模型、AI PPT 编排创作引擎、AI PPT 在线编辑模组三大技术升级。据介绍，讯飞智文 2.0 依托讯飞星火 V4.0 的底座能力，在文本生成方面进行了独立训练，对用户输入的主题具备更强大的理解能力。用户在“主题创建”中输入一句话主题，再勾选“联网搜索”，大模型即可自动抓取实时资讯，以确保事实的时效性、准确性。▲ 图为讯飞智文 1.0 生成结果▲ 图为讯飞智文 2.0 生成结果官方表示，讯飞智文 2.0 对长文本的内容理解、

8/12/2024 8:53:58 AM

清源

统信发布中国首款操作系统级端侧模型 UOS LM，支持问答、翻译、创作等

感谢统信软件今日宣布，中国首款操作系统级端侧模型 UOS LM 正式发布。目前，UOS LM 端侧模型面向所有统信 UOS 社区版（deepin V23）用户发起定向邀约内测，添加 deepin 小助手申请内测资格。为保证流畅体验，统信推荐以下硬件性能：1.5B 模型：内存 2G，GPU 显存 4G，10TOPS7B 模型：内存 8G，GPU 显存 10G，20TOPS对于个人用户，UOS LM V1.0 版本实现本地文档构建知识库，并通过向量数据库支持基于语义的相似性搜索和向量分析操作，帮助用户通过 UOS AI

8/8/2024 7:49:10 PM

浩渺

无一大模型及格！北大 / 通研院提出超难基准 LooGLE，专门评估长文本理解生成

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估 LLMs 对长文本的处理和检索能力，又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道，一评估发现这些模型在复杂的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像 Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex 这种商业模型，

8/7/2024 12:46:42 PM

汪淼

OpenAI 开发 ChatGPT「反作弊神器」：99.9% 超高命中率，但没发布

感谢AI在线网友 Xiaozhi 的线索投递！去各大高校图书馆转一圈，会发现头上一副耳机、手边一杯咖啡，电脑上一个 AI 工具网页几乎成了当代大学生标配。学生热衷于在 ChatGPT 的帮助下完成作业，教师们却头疼于无法杜绝学生用 ChatGPT 作弊的行为。人工智能可以根据一个提示，在几秒钟内免费创建整篇论文或研究论文。教师和教授表示，他们迫切需要帮助来打击滥用行为。《每日邮报》2023 年 1 月 30 报道称，UNSW 的 1 名学生使用 ChatGPT 自动生成论文被抓，这也是全澳第一个使用 AI 技术作弊

8/5/2024 1:22:51 PM

汪淼

OpenAI 承认正研发 ChatGPT 文本水印，但面临挑战

据《华尔街日报》报道，OpenAI 已经开发出一款能够高精度识别 ChatGPT 生成文本的工具，但迟迟未发布。对此 OpenAI 进行了回应，承认正在研究文本水印技术，但表示这项技术仍存在诸多挑战。图源 Pexels据AI在线了解，通过文本水印，OpenAI 将只专注于检测来自 ChatGPT 的文字，而不是来自其他公司模型的文字。其将通过对 ChatGPT 选择单词的方式进行微小的更改来实现这一点，本质上是在文字中创建一个不可见的水印，以后可以被一个单独的工具检测到。OpenAI 称，文本水印是他们探索的多种解

8/5/2024 7:12:17 AM

远洋

科大讯飞星火 Spark Pro-128K 大模型开放调用，最低 0.21 元 / 万 tokens

科大讯飞今日宣布，讯飞星火 API 正式开放长上下文版本 —— Spark Pro-128K 大模型，价格最低 0.21 元 / 万 tokens。据介绍，用户与大模型之间的对话交流，通常被认为是短期记忆。一旦对话长度超过了其上下文承载能力，超出的部分就可能会被模型遗忘。区别于传统的文本处理模型，长文本模型具备更准确的文本理解和生成能力以及更强大的跨领域迁移能力，可以一次性理解和生成更多的信息，适用于复杂的对话、长篇内容创作和详细的数据分析等任务，能提升模型解决问题的边界。6 月 27 日，讯飞星火 V4.0 发布

7/18/2024 6:24:36 PM

汪淼

中山大学联合字节智创数字人团队提出MMTryon虚拟试穿框架，效果优于现有SOTA

虚拟换装技术在特效以及电商的场景下有着广泛的应用，具有较高的商业潜质与价值。近期，中山大学联合字节跳动智能创作数字人团队提出了一种多模态多参考虚拟试穿 (VITON) 框架 MMTryon，可以通过输入多个服装图像及指定穿法的文本指令来生成高质量的组合试穿结果。对于单图换装，MMTryon有效的利用了大量的数据设计了一个表征能力强大的服装编码器, 使得该方案能处理复杂的换装场景及任意服装款式；对于组合换装，MMTryon消除了传统虚拟换装算法中对服装精细分割的依赖，可依靠一条文本指令从多张服装参考图像中选择需要试穿

7/8/2024 3:42:00 PM

新闻助手

22个任务超越SOTA，43个任务媲美SOTA，Google推出医学治疗通用大模型

编辑 | 萝卜皮医生和科学家如果想开发一种新的疗法，这将是一个漫长且昂贵的任务，需要满足许多不同的标准，而能够加快这一过程的人工智能模型将是无价之宝。然而，目前大多数人工智能方法只能解决一组定义狭窄的任务，通常局限于特定领域。为了弥补这一差距，Google 团队提出了 Tx-LLM，这是一种通用大型语言模型（LLM），由 PaLM-2 微调而成，可编码有关各种治疗方式的知识。仅使用一组权重，Tx-LLM 可同时处理与自由文本交织的各种化学或生物实体（小分子、蛋白质、核酸、细胞系、疾病）信息，使其能够预测广泛的相关属

6/12/2024 2:36:00 PM

ScienceAI

视觉语言模型导论：这篇论文能成为你进军VLM的第一步

近些年，语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型（LLM）有能力解决多种不同的任务，它们也正在成为越来越常用的工具。这些模型之前基本都局限于文本输入，但现在也正在具备处理视觉输入的能力。如果能将视觉与语言打通，那么势必能造就多种多样的应用 —— 这实际上也正是当前 AI 技术革命的关键方向。即便现在已有不少研究将大型语言模型扩展到了视觉领域，但视觉与语言之间的连接尚未被彻底打通。举些例子，大多数模型都难以理解空间位置关系或计数 —— 这还需要复杂的工程设计并依赖额外的数据标注。许多视

6/11/2024 2:45:00 PM

机器之心

科大讯飞：讯飞星火 V4.0 正在训练中，对标 GPT-4o 的产品也在研发

科大讯飞在“深交所互动易”平台回复网友提问时透露，对标 GPT-4 当前能力的讯飞星火 V4.0 正在训练中，预计在 2024 年 6 月底发布，对标 GPT-4o 的产品正在研发中。科大讯飞方面表示，公司将紧密结合人工智能的演进和突破，把成果持续应用到智慧教育的每个产品中，不断提升产品的用户体验和客户渗透率。而在今年 4 月，科大讯飞董事长刘庆峰曾透露，今年 6 月 27 日，讯飞星火 V4.0 将正式发布。刘庆峰当时表示，星火大模型（IT之家注：讯飞星火大模型 V3.5）的通用长文本能力，包括长文档信息抽取、长

6/2/2024 4:30:06 PM

清源

AI 赋能剪贴板：微软 PowerToys 新增“高级粘贴”功能

微软正为 PowerToys 加入一项名为“高级粘贴”的新功能，其利用人工智能的强大功能，可以实时转换剪贴板内容。这项新功能能够帮助用户提升工作效率，例如将一种编程语言的代码复制粘贴成另一种语言的代码。不过，要使用高级粘贴功能的一些更高级特性，需要 OpenAI API。“高级粘贴”包含在 PowerToys 0.81 版本中，启用后可以通过组合键 Windows 键 Shift V 调出。这会打开一个 “高级粘贴” 文本窗口，提供纯文本、markdown 和 JSON 等粘贴格式转换选项。如果在“高级粘贴

5/22/2024 7:47:13 PM

远洋

AI在用 | 原来，360 AI浏览器还能轻松编辑长视频

编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。视频为王。不过，和视频生成领域的精彩纷呈相比，剪辑战场总差那么一口气。就拿长视频剪辑来说，费时费力，趁手的 AI 剪辑兵器却不多， Spikes Studio 、Nova A.I.、剪映....... 一只手也能数的过来。现在，又

5/22/2024 7:30:00 PM

机器之能

讯飞星火 Lite API 能力免费开放：在线联网搜索、低算力推理场景

感谢科大讯飞今日官宣，旗下讯飞星火 Lite API 永久免费开放，支持在线联网搜索、适用于低算力推理与模型精调等定制化场景。IT之家注：讯飞星火 Pro / Max API 价格为：0.21 元 / 万 tokens。据介绍，1token 相当于 1.5 个中文汉字，用户付费 0.21 元即可调用“讯飞星火 3.5 Max”生成一部“余华《活着》”的内容量。讯飞星火大模型 V3.5 发布于今年 1 月，该模型带来七大能力提升：文本生成提升 7.3%，语言理解提升 7.6%，知识问答提升 4.7%，逻辑推理提升 9

5/22/2024 10:39:07 AM

归泷（实习）

Meta 首发「变色龙」挑战 GPT-4o，34B 参数引领多模态革命！10 万亿 token 训练刷新 SOTA

【新智元导读】GPT-4o 发布不到一周，首个敢于挑战王者的新模型诞生！最近，Meta 团队发布了「混合模态」Chameleon，可以在单一神经网络无缝处理文本和图像。10 万亿 token 训练的 34B 参数模型性能接近 GPT-4V，刷新 SOTA。GPT-4o 的横空出世，再次创立了一个多模态模型发展的新范式！为什么这么说？OpenAI 将其称为「首个『原生』多模态」模型，意味着 GPT-4o 与以往所有的模型，都不尽相同。传统的多模态基础模型，通常为每种模态采用特定的「编码器」或「解码器」，将不同的模态分

5/19/2024 6:54:10 PM

清源

讯飞星火大模型 V3.5 春季上新，V4.0 官宣 6 月 27 日发布

感谢科大讯飞今日官宣，讯飞星火大模型 V3.5 春季上新，科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能。刘庆峰表示，目前星火大模型通用长文本能力，包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等，总体已经达到 GPT-4 Turbo 今年 4 月最新长文本版本的 97% 的水平，而在多个垂直领域的知识问答任务上，星火大模型长文本总体水平已经超过 GPT-4 Turbo。讯飞星火大模型 V3.5 进行了多项更新，IT之家汇总如下：支持长文本、长图文、长语音的大模型上新，首发星火图文识别大模型

4/26/2024 10:37:25 AM

汪淼

360 智脑 7B 参数大模型开源，支持 50 万字长文本输入

感谢360 公司日前在 GitHub 上开源了 360 智脑 7B（70 亿参数模型）。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练，以中文、英文、代码为主，开放 4K、32K、360K 三种不同文本长度。360 表示，360K（约 50 万字）是当前国产开源模型文本长度最长的。360 表示，他们在 OpenCompass 的主流评测数据集上验证了模型性能，包括 C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、L

4/12/2024 6:30:18 PM

沛霖（实习）

周鸿祎自称“开源信徒”：宣布将开源 360 智脑 7B 模型，支持 50 万字长文本输入

感谢360 创始人周鸿祎近日透露即将开源 360 智脑 7B（70 亿参数模型），支持 360k（50 万字）长文本输入。周鸿祎表示，前段时间大模型行业卷文本长度，100 万字“很快将是标配”。“我们打算将这个能力开源，大家没必要重复造轮子，定为 360k 主要是为了讨个口彩。”他还自称“开源的信徒”，信奉开源的力量。据介绍，360 智脑长文本能力已入驻大模型产品“360AI 浏览器”。周鸿祎还谈到了小模型的优势：其认为小模型速度快、用户体验也好，单机单卡就能跑，具备更高的性价比。目前，360AI 浏览器已向用户免

3/29/2024 3:27:56 PM

清源

来自一线大咖的前沿观察与洞见，大模型技术 Workshop 第一期活动举行

为了更好地分享大模型技术最新进展，张江科投、张江孵化器、机器之心、WAIC Circle 联合发起举办了“大模型技术 Workshop”系列活动，邀请产学研一线大咖带来前沿观察与洞见。3月22日，大模型技术 Workshop 第一期成功举行。本次活动围绕“Claude 3热浪来袭，一起聊聊文本大模型的重点技术路径”展开，并得到了张江科学城商会的大力支持。张江孵化器总经理金红梅张江孵化器总经理金红梅介绍，作为张江集团向“卓越的创新策源和产业发展生态综合服务商”战略转型中聚焦创新策源的主要板块，张江科投坚持以产业促进为

3/27/2024 10:21:00 AM

新闻助手

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战 DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI 模态编码器|CLIP详细解读 50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习 GPT 开源微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 神器推荐 LLaMA 大语言模型具身智能字节跳动 Claude 算力安全应用视频生成科技视觉干货合集亚马逊 2024 AGI 特斯拉 DeepMind 架构