模式

全球首款GESP融合视觉传感器ALPIX-Pizol问世，锐思智芯拓宽机器感知动态新视界

3月31日，领先的融合视觉传感器研发商锐思智芯® 正式发布全球首款将全局曝光图像技术与EVS事件感知技术实现像素级融合的融合视觉传感器——ALPIX-Pizol®。作为全球首款将出色的暗光性能、高帧率运动捕捉、高光比动态成像和超低功耗感知特性集于一身的视觉传感器，ALPIX-Pizol® 为低算力、低功耗端侧AI感知、超低功耗成像、无人机、机器人与智慧城市领域的前沿客户提供突破性的多模态融合视觉方案，赋能端侧AI与空间智能产业生态。 GESP像素设计三合一模式，重构AI感知新维度ALPIX-Pizol® 是一款1/4英寸、由1.3M GESP™ （Global Event Sensing Pixel）像素组成的视觉传感器，它提供了图像、事件和融合等三种工作模式，每个工作模式下可以选择常规与低功耗设置，模式间可实现毫秒级切换。

3/31/2025 3:17:00 PM

新闻助手

Grok 语音模式全面开放：11 种模式上线，自带字幕成英语学习利器

xAI 公司开发的 AI 助手 Grok 今日宣布，其备受期待的语音模式已正式向所有用户开放。这一更新不仅带来了11种独特的语音交互模式（包括2种18 限制模式），还新增了语音字幕功能，被用户称为“学习英语的好工具”。消息在 X 平台上迅速传播，引发了广泛的兴奋与讨论。

3/5/2025 11:00:00 AM

AI在线

OpenAI免费开放ChatGPT高级语音聊天模式基于GPT-4o mini

2月26日，OpenAI公司在X平台发布推文，正式向广大用户宣布，即日起将免费开放ChatGPT的高级语音模式（Advanced Voice Mode）。据悉，ChatGPT的高级语音模式基于GPT-4o mini模型，通过优化计算效率，在性能方面已经能够媲美完整版的GPT-4o模型。目前，macOS以及Windows10、Windows11系统的ChatGPT桌面应用程序均已支持高级语音模式，提供了5种语音选择，并支持自定义提示和对话内容回顾功能。

2/26/2025 10:56:00 AM

AI在线

向DeepSeek学习深度思考-十大思维链模式和案例分析

在这个复杂性与不确定性交织的时代，我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。当常规的直觉反应和零散的思考难以应对精密问题时，结构化思维链就像一柄思维解剖刀——它帮助我们在乱麻中梳理出清晰的脉络，在混沌中发现隐藏的逻辑路径。在我上一篇文章已经谈到，学习DeepSeek深度思考中CoT思维链的内容往往比最终的问题答案更加重要。

2/14/2025 5:00:00 AM

何明璐

活久见，贝多芬的第九交响曲竟然跟材料结构有相似性，一幅艺术画作让大模型诞生新生物材料！MIT基于图形的人工智能模型厉害了！

出品 | 51CTO技术栈（微信号：blog51cto）太酷了，12日消息，麻省理工大学研究团队发表了一篇新的研究结果。研究发现：通过大模型的加持，科学和艺术竟然存在某种隐藏联系，进而可以生成新的生物材料。图片基于图形的人工智能模型（中）建议创建一种新的基于菌丝体的生物材料（右），其灵感来自于瓦西里·康定斯基的画作《第七幅作品》（左）马库斯·布勒（Markus Buehler）在其新人工智能系统的帮助下（中、右）1.图推理拉高AI科学新高度近日，MIT 教授 Markus Buehler 开发的一种名为GraphReasoning（图推理）的人工智能方法，并进行了两项非常nice的实验。

11/13/2024 1:38:16 PM

o1不是唯一路径！MIT新研究：在测试时训练，模型推理能力最高升至5.8倍

o1不是通向大模型推理的唯一路径！ MIT的新研究发现，在测试时对大模型进行训练，可以让推理水平大幅提升。在挑战超难的ARC任务时，准确率最高可提升至原来的5.83倍。

11/12/2024 12:53:46 PM

新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式

科技媒体 testingcatalog 昨日（9 月 18 日）发布博文，报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式，甚至可能是直接正式发布。OpenAI 于今年 7 月宣布向一小部分 ChatGPT Plus 用户开放 ChatGPT 的高级语音模式，让用户首次获得 GPT-4o 的超现实音频响应。AI在线援引该媒体报道，OpenAI 公司已更新高级语音模式 FAQ 页面，在代码中被发现“hasSeenAdvancedVoice/2024-09-24”的字符串，

9/19/2024 9:08:32 AM

故渊

Midjourney 的 Style Raw 模式到底怎么用？一篇文章帮你弄懂！

大家好，这里是和你们一起探索 AI 的花生~ 与 stylize、chaos 一样，style raw 也是 Midjourney 出图中常用的的参数之一，可以帮我们实现特定的出图需求，但肯定有很多小伙伴依旧对它的具体作用不太了解，今天就通过这篇文章，详细为大家讲解一下 style raw 的适用场景和使用方法。上期回顾：一、Style Raw 简介之前我们提到过，Midjourney 的默认模型（ v5.2、v6 等）是自带 “美学滤镜” 的，它们在生成图像时会进行一定的风格化处理，让画面更有艺术性、更好看。

7/5/2024 7:39:14 AM

夏花生

MaxCompute执行引擎核心技术DAG揭秘

作为业界少有的EB级别数据分布式平台，MaxCompute系统每天支撑上千万个分布式作业的运行。在这个量级的作业数目上，毫无疑问平台需要支撑的作业特点也多种多样：既有在"阿里体量"的大数据生态中独有的包含数十万计算节点的超大型作业，也有中小规模的分布式作业。同时不同用户对于不同规模/特点的作业，在运行时间，资源使用效率，数据吞吐率等方面，也有着不同的期待。Fig.1 MaxCompute线上数据分析基于作业的不同规模，当前MaxCompute平台提供了两种不同的运行模式，下表对于这两种模式做了总结对比:Fig.2

8/25/2021 2:46:00 PM

阿里云大数据AI技术

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

模式

全球首款GESP融合视觉传感器ALPIX-Pizol问世， 锐思智芯拓宽机器感知动态新视界