模式
全球首款GESP融合视觉传感器ALPIX-Pizol问世, 锐思智芯拓宽机器感知动态新视界
3月31日,领先的融合视觉传感器研发商锐思智芯® 正式发布全球首款将全局曝光图像技术与EVS事件感知技术实现像素级融合的融合视觉传感器——ALPIX-Pizol®。 作为全球首款将出色的暗光性能、高帧率运动捕捉、高光比动态成像和超低功耗感知特性集于一身的视觉传感器,ALPIX-Pizol® 为低算力、低功耗端侧AI感知、超低功耗成像、无人机、机器人与智慧城市领域的前沿客户提供突破性的多模态融合视觉方案,赋能端侧AI与空间智能产业生态。 GESP像素设计 三合一模式,重构AI感知新维度ALPIX-Pizol® 是一款1/4英寸、由1.3M GESP™ (Global Event Sensing Pixel)像素组成的视觉传感器,它提供了图像、事件和融合等三种工作模式,每个工作模式下可以选择常规与低功耗设置,模式间可实现毫秒级切换。
3/31/2025 3:17:00 PM
新闻助手
Grok 语音模式全面开放:11 种模式上线,自带字幕成英语学习利器
xAI 公司开发的 AI 助手 Grok 今日宣布,其备受期待的语音模式已正式向所有用户开放。 这一更新不仅带来了11种独特的语音交互模式(包括2种18 限制模式),还新增了语音字幕功能,被用户称为“学习英语的好工具”。 消息在 X 平台上迅速传播,引发了广泛的兴奋与讨论。
3/5/2025 11:00:00 AM
AI在线
OpenAI免费开放ChatGPT高级语音聊天模式 基于GPT-4o mini
2月26日,OpenAI公司在X平台发布推文,正式向广大用户宣布,即日起将免费开放ChatGPT的高级语音模式(Advanced Voice Mode)。 据悉,ChatGPT的高级语音模式基于GPT-4o mini模型,通过优化计算效率,在性能方面已经能够媲美完整版的GPT-4o模型。 目前,macOS以及Windows10、Windows11系统的ChatGPT桌面应用程序均已支持高级语音模式,提供了5种语音选择,并支持自定义提示和对话内容回顾功能。
2/26/2025 10:56:00 AM
AI在线
向DeepSeek学习深度思考-十大思维链模式和案例分析
在这个复杂性与不确定性交织的时代,我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。 当常规的直觉反应和零散的思考难以应对精密问题时,结构化思维链就像一柄思维解剖刀——它帮助我们在乱麻中梳理出清晰的脉络,在混沌中发现隐藏的逻辑路径。 在我上一篇文章已经谈到,学习DeepSeek深度思考中CoT思维链的内容往往比最终的问题答案更加重要。
2/14/2025 5:00:00 AM
何明璐
活久见,贝多芬的第九交响曲竟然跟材料结构有相似性,一幅艺术画作让大模型诞生新生物材料!MIT基于图形的人工智能模型厉害了!
出品 | 51CTO技术栈(微信号:blog51cto)太酷了,12日消息,麻省理工大学研究团队发表了一篇新的研究结果。 研究发现:通过大模型的加持,科学和艺术竟然存在某种隐藏联系,进而可以生成新的生物材料。 图片基于图形的人工智能模型(中)建议创建一种新的基于菌丝体的生物材料(右),其灵感来自于瓦西里·康定斯基的画作《第七幅作品》(左)马库斯·布勒(Markus Buehler)在其新人工智能系统的帮助下(中、右)1.图推理拉高AI科学新高度近日,MIT 教授 Markus Buehler 开发的一种名为GraphReasoning(图推理)的人工智能方法,并进行了两项非常nice的实验。
11/13/2024 1:38:16 PM
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
o1不是通向大模型推理的唯一路径! MIT的新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升。 在挑战超难的ARC任务时,准确率最高可提升至原来的5.83倍。
11/12/2024 12:53:46 PM
新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式
科技媒体 testingcatalog 昨日(9 月 18 日)发布博文,报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式,甚至可能是直接正式发布。OpenAI 于今年 7 月宣布向一小部分 ChatGPT Plus 用户开放 ChatGPT 的高级语音模式,让用户首次获得 GPT-4o 的超现实音频响应。AI在线援引该媒体报道,OpenAI 公司已更新高级语音模式 FAQ 页面,在代码中被发现“hasSeenAdvancedVoice/2024-09-24”的字符串,
9/19/2024 9:08:32 AM
故渊
Midjourney 的 Style Raw 模式到底怎么用? 一篇文章帮你弄懂!
大家好,这里是和你们一起探索 AI 的花生~
与 stylize、chaos 一样,style raw 也是 Midjourney 出图中常用的的参数之一,可以帮我们实现特定的出图需求,但肯定有很多小伙伴依旧对它的具体作用不太了解,今天就通过这篇文章,详细为大家讲解一下 style raw 的适用场景和使用方法。
上期回顾:一、Style Raw 简介
之前我们提到过,Midjourney 的默认模型( v5.2、v6 等)是自带 “美学滤镜” 的,它们在生成图像时会进行一定的风格化处理,让画面更有艺术性、更好看。
7/5/2024 7:39:14 AM
夏花生
MaxCompute执行引擎核心技术DAG揭秘
作为业界少有的EB级别数据分布式平台,MaxCompute系统每天支撑上千万个分布式作业的运行。在这个量级的作业数目上,毫无疑问平台需要支撑的作业特点也多种多样:既有在"阿里体量"的大数据生态中独有的包含数十万计算节点的超大型作业,也有中小规模的分布式作业。同时不同用户对于不同规模/特点的作业,在运行时间,资源使用效率,数据吞吐率等方面,也有着不同的期待。Fig.1 MaxCompute线上数据分析基于作业的不同规模,当前MaxCompute平台提供了两种不同的运行模式,下表对于这两种模式做了总结对比:Fig.2
8/25/2021 2:46:00 PM
阿里云大数据AI技术
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
本地部署DeepSeek+DiFy平台构建智能体应用
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练