资讯列表

分类

标签

微软 Win11 Copilot 应用新功能：文件搜索与视觉助手开启测试

微软在50周年纪念活动上宣布Windows 11 Copilot新增文件搜索和视觉助手功能，现已向Windows Insider用户开放测试。文件搜索支持多格式文档内容查询，视觉助手可分析应用窗口内容并提供语音指导。#微软# #Windows11#

4/9/2025 7:23:48 AM

远洋

亚马逊推出全新 AI 语音模型 Nova Sonic，叫板 OpenAI 和谷歌

亚马逊发布新一代生成式AI语音模型Nova Sonic，性能媲美OpenAI和谷歌，支持多语言识别，错误率低至4.2%，响应速度更快。该模型已集成到Alexa+中，未来将开放更多AI模型给开发者。#AI语音##亚马逊AI#

4/9/2025 7:14:41 AM

远洋

皮尤报告：美国公众对 AI 态度消极

皮尤研究中心最新报告显示，43%的美国成年人认为AI可能带来伤害，仅24%认为有益。苹果若能解决隐私和易用性问题，或能抓住这一市场机遇。#人工智能##苹果#

4/9/2025 6:59:03 AM

远洋

斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

就在刚刚，每年都备受瞩目的斯坦福AI指数报告，重磅发布了！这份报告由斯坦福大学以人为本AI研究员发布，代表着每年AI领域最核心和前沿的动向总结。今年，这份报告长达456页，抛出不少惊人观点。

4/9/2025 4:22:00 AM

新智元

Llama 4遭竞技场背刺！实锤用特供版刷榜，2000+对战记录公开

Llama 4真要被锤爆了，这次是大模型竞技场（Chatbot Arena）官方亲自下场开怼：竞技场上，Meta提供给他们的是特供版！以下是竞技场背后lmarena.ai团队的原话：我们注意到社区对Llama-4最新版本在Arena平台的发布存在疑问。为确保完全透明，现公开2000余组模型对战数据供公众审阅，包含用户提示词、模型回复及用户偏好数据（链接详见下一条推文）。

4/9/2025 3:33:00 AM

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型

vLLM（Virtual Large Language Model）是由加州大学伯克利分校团队开发的高性能大模型推理框架，其核心特点围绕显存优化、高吞吐量、灵活性和易用性展开。对比 ollama 作为个人开发者部署模型工具而言，vLLM 专注于高并发请求和大规模生产环境，适用于企业级应用和需要高效推理的场景。 vLLM 通过优化内存管理和并发处理，适合处理高负载的生产环境。

4/9/2025 3:25:00 AM

PandaAI 是一个基于 Python 开发的自然语言处理和数据分析工具，支持问答式（ChatGPT）的数据分析和报告生成功能。 PandaAI 提供了一个开源的框架，主要核心组件包含用于数据处理的数据准备层（Pandas）以及实现 Text2SQL 功能的自然语言接口。数据源PandaAI 支持文件、数据库以及大数据平台等多种数据源连接，包括 Excel、CSV、MySQL、PostgreSQL、Oracle、Microsoft SQL Server、Databricks、Redshift、Snowflake、ClickHouse、Supabase、BigQuery、Salesforce 等。

4/9/2025 3:00:00 AM

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

DeepMind对CLIP改进的一篇工作--SigLIP，发表在2023CVPR。简单看下研究动机：传统的对比学习方法如CLIP等依赖于 softmax 归一化，这需要一个全局视角来计算成对相似度，从而限制了批处理大小的扩展能力，并且在小批处理大小下表现不佳。因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练（SigLIP）。

4/9/2025 2:10:00 AM

Goldma

50组多风格提示词，全面测评Midjourney V7生图效果！

嗨大家好！原本说好 2 月底就上的 Midjourney V7，今天终于来了！那年杏花微雨，一张《太空歌剧院》冲破云霄，带来的震撼与欣喜至今仍让人记忆犹新。

4/9/2025 1:26:46 AM

阿真Irene

AI时代下数字化转型最大陷阱！是没数据，还是没用对数据？

许多企业谈起数字化转型，第一反应就是"我们没有数据基础"。真相是，企业不缺数据，缺的是对数据价值的挖掘。企业只要存续经营，就在不断产生大量数据，这些未被充分利用的数据就像沉睡的金矿，等待被唤醒创造价值...数据早已存在，只是未被唤醒企业数据无处不在。

4/9/2025 1:20:00 AM

大数据AI智能圈

大模型+数据分析：下一代智能查询优化体系的先行探索

当你每天面对万亿级数据、日均百万次查询请求时，你会怎么做？处理海量数据查询犹如在迷雾中寻路，方向稍有不慎就会迷失。数据负载高到屏幕只显示超时，查询速度慢到让你有时间泡一杯咖啡再来检查结果。

4/9/2025 1:00:00 AM

大数据AI智能圈

ChatGPT的危险之处：你永远不应该告诉AI机器人的五件事

但这个征服世界的大型语言模型聊天机器人被描述为一个“隐私黑洞”，人们担心它处理用户数据的方式，这甚至导致它在意大利被短暂封禁。它的创造者OpenAI毫不掩饰这样一个事实：任何输入的数据都可能不安全。这些数据不仅可能被用于进一步训练其模型，从而可能暴露给其他用户，而且还可能被人工审核，以检查其是否符合使用规则。

4/9/2025 12:13:00 AM

Bernard Marr

华为云发布Stack可信数智空间解决方案，赋能可信数据空间探索

4 月 8 日，以 “乘数黔行，智华未来” 为主题的可信 AI 数据空间价值共创（贵州）高峰论坛成功举办。论坛齐聚政府机构、头部企业以及专家学者等政产研多方代表，围绕数据与 AI 协同发展进行深度探讨，共话可信数据空间发展趋势与未来机遇，助力贵州国家数据要素综合试验区高质量发展。会上，贵州省大数据发展管理局与华为云作为主要发起单位，联合中国信通院及相关企业启动 “可信 AI 数据空间” 创新探索，推动公共数据价值释放、服务各行各业。

4/9/2025 12:03:00 AM

新闻助手

超仿真：全球首款可拉伸电子皮肤触觉传感器产品亮相，能感知 1 克物体所产生的力

据央视财经消息，全球首款可拉伸电子皮肤触觉传感器产品已正式亮相，该产品采用超仿真设计，能拉伸、揉搓，可感知 1 克物体所产生的力。

4/8/2025 10:37:14 PM

归泷

20万+围观GPT-4o整出Gif！我们玩出新高度

编辑 | Sia这届网友真是把 AI 玩出花！继谷歌 Gemini 2.0 Flash 去水印骚操作后，Reddit 社区的老哥们又用 GPT-4o 解锁动画制作新姿势——直接生成动画关键帧。只需简单指令，模型直接吐出连贯动作序列帧，丝滑程度堪比动画师原画。

4/8/2025 9:21:00 PM

AI好好用

谷歌 Gemini AI 升级文件分析功能，将支持 3GP、AVI、MP4 等八种视频格式

4 月 8 日消息，科技媒体 Android Authority 今天（4 月 8 日）发布博文，通过分析 APK 文件，发现谷歌 Gemini 即将升级文件分析功能，新增支持 3GP、AVI、FLV 等 8 种视频格式。 Gemini 现有文件分析功能支持文档、代码、表格等类型，但暂不支持视频处理。该媒体分析 Google App 16.13.38 测试版代码，发现 Gemini 该功能将兼容 3GP、AVI、FLV、MOV、MP4 等主流视频格式。

4/8/2025 6:43:44 PM

故渊

迈向机器人领域ImageNet，大牛Pieter Abbeel领衔国内外高校共建RoboVerse，统一仿真平台、数据集和基准

大规模数据集和标准化评估基准显著促进了自然语言处理和计算机视觉领域的发展。然而，机器人领域在如何构建大规模数据集并建立可靠的评估体系方面仍面临巨大挑战。一方面，采集真实世界的机器人数据需要消耗大量资源（如时间、硬件成本），且效率低下；另一方面，在现实场景中测试机器人性能面临复杂的环境配置，难以控制变量并标准化。

4/8/2025 6:38:00 PM

机器之心

UI-R1|仅136张截图，vivo开源DeepSeek R1式强化学习，提升GUI智能体动作预测

基于规则的强化学习（RL/RFT）已成为替代 SFT 的高效方案，仅需少量样本即可提升模型在特定任务中的表现。该方法通过预定义奖励函数规避人工标注成本，如 DeepSeek-R1 在数学求解中的成功应用，以及多模态领域在图像定位等任务上的性能突破（通常使用 IOU 作为规则 reward）。 vivo 与香港中文大学的研究团队受到 DeepSeek-R1 的启发，首次将基于规则的强化学习（RL）应用到了 GUI 智能体领域。

4/8/2025 6:33:00 PM