AI在线 AI在线

应用

无需训练!Q-Filters 实现 KV 缓存高效压缩,提升推理性能

近年来,基于 Transformer 架构的大型语言模型(LLMs)取得了显著进展,诸如 Gemini-Pro1.5、Claude-3、GPT-4和 Llama-3.1等新模型能够处理成百上千的token。 然而,这些扩展的上下文长度带来了实际应用中的一些重大挑战。 随着序列长度的增加,解码延迟上升,内存限制也成为了一个严重的瓶颈。
3/12/2025 11:03:15 AM
AI在线

LLMs.txt生成器 v2发布:网站文本转换速度提升10倍

近日,LLMs.txt生成器迎来重大升级,正式推出v2版本。 这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型(LLM)使用的文本文件,为AI应用的开发者和使用者带来了极大便利。 新版本由@firecrawl_dev团队开发,并得到其官方llmstxt端点的全力支持,相较于上一代,处理速度提升了惊人的10倍。
3/12/2025 10:53:00 AM
AI在线

联发科发布 Genio 720/520 物联网平台:6nm 制程,AI 算力 10 TOPS

这两款产品支持先进的生成式 AI 模型、人机界面、多媒体和连接功能,适用于广泛 IoT 设备。
3/12/2025 10:46:40 AM
溯波(实习)

OpenAI突然发布智能体API!支持网络和文件搜索以及computer use

「Agent/智能体」可说是当今 AI 领域最炙手可热的话题。 今天凌晨,OpenAI 发布了一系列可让开发者通过 API 构建智能体的新工具,其中最大的看点便是 Responses API⁠,这是对之前的 Chat Completions API 的一轮大升级,使其获得了 Assistants API 般使用工具的能力,从而可以帮助开发者构建智能体。 目前,Responses API⁠ 已经内置了网络搜索、文件搜索和计算机使用(computer use)能力。
3/12/2025 10:35:00 AM
机器之心

一行代码、无需训练突破视频生成时长「魔咒」,清华朱军团队开源全新解决方案RIFLEx

自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。 去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-ViT,发布了首个国产全自研视频大模型 Vidu,打破国外技术垄断,支持一键生成 16 秒高清视频,展现出中国科技企业的创新实力。 Vidu 自去年 7 月上线以来,已服务数千万用户,极大促进了视频内容的智能创作。
3/12/2025 10:25:00 AM
机器之心

Manus与阿里云通义千问达成合作,共推国产AI智能体产品

人工智能Agent产品新秀Manus与阿里云旗下大语言模型通义千问近日达成战略合作。 根据Manus在其视频号"Manus AI"发布的消息,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。 目前两家技术团队已开始紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。
3/12/2025 10:00:41 AM
AI在线

重生之我在小红书给AI当老板 元宝动不动崩溃,DeepSeek天天摸鱼

这年头,谁还没个AI打工仔?但你见过直接在群聊里遥控AI军团的赛博老板吗?最近,小红书上就火爆了这样一股清奇画风——网友们纷纷化身AI公司的“霸道总裁”,在群聊里对一众AI模型指点江山,发号施令,上演了一出啼笑皆非的AI职场大戏。 始作俑者是小红书网友Komorebi,她的一条也是当上AI的领导了的图文笔记,瞬间点燃了网友们的玩梗热情。 只见她煞有介事地建了一个工作群,自己当起了人类CEO,一本正经地指挥群里的AI员工们打卡签到。
3/12/2025 9:53:00 AM
AI在线

告别平面!MIDI:可提取图片元素生成360度3D场景

还在对着二维照片里的美好场景望眼欲穿?梦想着能身临其境地漫步在那些迷人画面之中?现在,这个愿望有望成为现实!来自CVPR2025的重磅研究——MIDI(Multi-Instance Diffusion for Single Image to3D Scene Generation,多实例扩散单图到3D场景生成)横空出世,它就像一位技艺高超的魔法师,仅凭一张普通的2D图片,就能为你构建出一个栩栩如生的360度3D场景。 一图胜千言?现在还能“变”出整个世界!想象一下,你拍摄了一张阳光洒落的咖啡馆一角,照片里有精致的桌椅、香气四溢的咖啡杯,以及窗外婆娑的树影。 过去,这仅仅是一张静态的平面图像。
3/12/2025 9:35:00 AM
AI在线

谷歌持有Anthropic14%股份,投资已达30亿美元

根据《纽约时报》获取的法律文件显示,谷歌目前持有人工智能初创公司Anthropic14%的股份,接近其允许持有的15%上限。 值得注意的是,尽管投资规模庞大,谷歌在Anthropic并不享有投票权、董事会席位或董事会观察员权。 据报道,谷歌迄今已向Anthropic投入了总计30亿美元的资金,并计划在2025年9月再追加7.5亿美元的投资。
3/12/2025 9:30:00 AM
AI在线

全国第二例判决 AI 版权案:法院确认作者享有著作权

AI 生成内容的知识产权问题带来了不少争议,而江苏省苏州市常熟市人民法院于3月7日宣判了一起备受瞩目的著作权纠纷案。 这起案件被认为是江苏省的首例、全国第二例涉及 AI 生成内容的著作权案。 案件的起因是林某使用 Midjourney 软件生成的图片作品引发的版权争议。
3/12/2025 9:25:00 AM
AI在线

Meta测试内部AI训练芯片,寻求减少对英伟达依赖

据路透社报道,Meta正在测试一种专为人工智能训练设计的内部芯片,这是该公司战略的重要组成部分,旨在降低对英伟达等硬件制造商的依赖。 这些芯片是Meta与台湾半导体制造巨头台积电(TSMC)合作生产的,专门用于处理人工智能特定的工作负载。 目前,Meta正在进行"小规模部署"测试,如果测试结果符合预期,公司计划扩大生产规模。
3/12/2025 9:11:00 AM
AI在线

OpenAI推出新工具帮助开发者构建AI代理

OpenAI周二发布了新的响应API(Responses API),旨在帮助开发人员和企业使用该公司的模型和框架构建能独立完成任务的AI代理。 这一工具包将有效取代OpenAI的助手API,后者计划在2026年上半年停用。 响应API允许企业开发自定义AI代理,这些代理可以执行网络搜索、扫描公司文件和浏览网站,功能类似于OpenAI的Operator产品。
3/12/2025 9:09:00 AM
AI在线

​DeepSeek官方回应:R2将在3 月17日发布传闻为虚假

日前有媒体报道称人工智能公司 DeepSeek 可能将在3月17日发布其下一代 R2模型的消息在网络上引发热议。 然而,DeepSeek 官方在用户群中对这一传闻进行了澄清,表示 “R2发布为假消息”。 据了解,DeepSeek 官方通过其企业咨询账号回应了这一虚假消息。
3/12/2025 8:57:00 AM
AI在线

百度AI开源表格识别模型PP-TableMagic

3月11日,百度AI宣布开源新一代表格识别解决方案PP-TableMagic,为表格结构化信息提取领域带来重大突破。 PP-TableMagic旨在解决传统表格识别技术在复杂场景下的局限性,通过创新的多模型组网架构,实现了高精度的端到端表格识别,并支持全场景高定制化的模型微调。 在当今数字化时代,大量重要表格数据仍以非结构化形式存在,如扫描文档中的统计表图片和PDF文件中的金融财报数据。
3/12/2025 8:27:00 AM
AI在线

阿里通义宣布开源R1-Omni模型 可提升多模态情感识别能力

3月11日,通义实验室团队宣布开源R1-Omni模型,为全模态模型的发展带来了新的突破。 该模型结合了强化学习与可验证奖励(RLVR)方法,专注于提升多模态情感识别任务中的推理能力和泛化性能。 R1-Omni的训练分为两个阶段。
3/12/2025 8:21:00 AM
AI在线

王炸组合DeepSeek+剪映!手把手教你打造小红书爆款视频!

内容视频化正在成为大势所趋,尤其在小红书平台"破圈"后。 相比图文载体,视频具备 3 倍以上的信息触达效率和优秀的用户留存率,但传统视频制作的高时间成本始终是设计师的最大创作瓶颈。 本文将带你解锁零剪辑基础也能快速产出优质视频内容的方法:AI 提效:从脚本到成片的智能创作链路.
3/12/2025 6:45:30 AM
团队58UXD

欧洲银行纷纷尝试 DeepSeek

The Information 报道,据相关人士透露,自今年 1 月以来,包括汇丰银行、英国国民西敏寺银行(英国四大银行之一)以及西班牙对外银行(BBVA)在内的欧洲主要金融机构,一直在将 DeepSeek 与其他 AI 模型一起进行测试。这和美国银行拒绝使用 DeepSeek 的态度截然不同。
3/11/2025 11:11:18 PM
陈俊熹

国内首个:清华大学、腾讯云、英特尔尝试用 AI 让数据库听懂自然语言

清华大学、腾讯云、英特尔于 3 月 7 日在北京宣布启动“数据库 AI 联合创新计划”,围绕数据库与大模型的交叉技术展开深度研究,推动数据库智能化升级,同时为 AI 应用构建高效数据基础设施。
3/11/2025 10:33:17 PM
汪淼