应用
三星重磅官宣!One UI 7携AI超能力4月7日全球启动更新,你的手机准备好了吗?
三星粉丝们注意了!这家科技巨头正式宣布,基于Android15的最新手机操作系统One UI7即将登场,并将于4月7日起在全球范围内陆续推送至现有手机和平板电脑。 美国地区的用户稍作等待,更新将于4月10日开始推送。 在美国,首批尝鲜One UI7的将是三星2024年的旗舰机型Galaxy S24系列,以及备受期待的折叠屏手机Fold6和Flip6。
3/19/2025 5:56:00 PM
AI在线
IBM与Hugging Face联手放大招!开源“文档解密神器”SmolDocling,复杂文档一键变结构化数据!
话说在计算机科学领域,将那些结构复杂的文档变成规整的数据,一直是个让人头疼的“老大难”问题。 以前的“土办法”,要么是各种模型“组团出道”,搞出一套复杂的流程,要么就得祭出“巨无霸”级别的多模态模型,虽然看起来很厉害,但动不动就“幻觉”,还特别“烧钱”。 不过最近由IBM和Hugging Face联手推出的SmolDocling,只有256M参数的开源视觉-语言模型(VLM),目标非常明确,就是要端到端地解决多模态文档转换的任务。
3/19/2025 5:41:00 PM
AI在线
原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
近年来,大型语言模型(LLM)通过大量计算资源在推理阶段取得了解决复杂问题的突破。 推理速度已成为 LLM 架构的关键属性,市场对高效快速的 LLM 需求不断增长。 其中,采用 Transformer 架构的模型虽然占据了主流,但在输入序列长度增加时,计算量会呈二次方增长。
3/19/2025 5:40:00 PM
机器之心
CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千
第一作者、第二作者分别为复旦大学研究生涂树源、邢桢,通讯作者为复旦大学吴祖煊副教授。 近年来,扩散模型在图像与视频合成领域展现出强大能力,为图像动画技术的发展带来了新的契机。 特别是在人物图像动画方面,该技术能够基于一系列预设姿态驱动参考图像,使其动态化,从而生成高度可控的人体动画视频。
3/19/2025 5:36:00 PM
机器之心
Anthropic 正为 Claude 聊天机器人开发语音功能,已和多方商讨合作
Anthropic公司正为其AI聊天机器人Claude开发语音功能,旨在提供更自然的用户界面。首席产品官Mike Krieger透露,公司已开发出语音功能原型,并与亚马逊及ElevenLabs等合作伙伴进行会谈,以加速语音体验的推出。
3/19/2025 5:09:58 PM
远洋
谷歌研发全新 AI 模型 TxGemma,助力新药物发现及研究
谷歌表示,这些 AI 模型将在本月晚些时候通过其 Health AI Developer Foundations 计划发布,能够理解“常规文本”,并解析化学物质、分子和蛋白质等不同“治疗实体”的结构。
3/19/2025 5:01:01 PM
清源
谷歌 Gemini 新增 Canvas 与音频概览功能,提升用户生产力
谷歌Gemini新增Canvas与音频概览功能,提升用户生产力。Canvas提供互动空间,支持写作与编程项目,音频概览则生成播客风格摘要。功能全球免费开放,助力创意实现。#谷歌Gemini##AI生产力#
3/19/2025 4:55:14 PM
远洋
腾讯最新财报显示AI战略进入重投入期 全年研发投入707亿
腾讯近期发布的财报数据显示,公司正全面加速AI领域的投入与布局。 2024年,腾讯研发投入达706.9亿元,七年累计投入已高达3912亿元。 资本开支方面更是亮眼,连续四个季度实现同比三位数增长,年度资本开支突破767亿元,同比增长221%,创下历史新高。
3/19/2025 4:55:00 PM
AI在线
扎克伯格:Meta 的 Llama 模型下载量已达 10 亿次
Meta 公司首席执行官马克・扎克伯格在 Threads 平台上宣布,Meta 的“开放”人工智能模型家族 Llama 的下载量已达到 10 亿次,相较于 2024 年 12 月初的 6.5 亿次下载量,在短短约三个月内增长了约 53%。
3/19/2025 4:33:17 PM
远洋
中国信通院启动 AI 大模型幻觉评测,总体涉及五种测试维度
中国信通院发起大模型幻觉测试,旨在评估AI在生成内容时的准确性与一致性,涉及7000余条中文样本,覆盖多学科维度。此举旨在推动大模型在关键领域的安全应用。 #大模型幻觉评测#
3/19/2025 4:20:14 PM
远洋
OpenAI星际之门项目首个数据中心将可容纳多达40万个英伟达芯片
据彭博社报道,OpenAI 正在大规模投资建立其首个名为 “星际之门”(Stargate)的基础设施项目,预计耗资达1,000亿美元。 该项目的首个数据中心综合体位于德克萨斯州的小城阿比林,计划能够容纳多达40万片 Nvidia 生产的强大 AI 晶片,一旦完全投入使用,将成为全球最大的人工智能算力中心之一。 图源备注:图片由AI生成,图片授权服务商Midjourney根据开发商 Crusoe 的说法,这个庞大的数据中心预计将在2026年中期完工,具备1.2吉瓦的发电容量。
3/19/2025 4:04:00 PM
AI在线
科技赋能生命!全国首个出生健康管理大模型CHANGE发布
一款名为“CHANGE”的全国首个出生健康管理大模型横空出世,它的诞生标志着我国在利用人工智能守护新生儿健康方面迈出了里程碑式的一步。 这款由DeepSeek赋能的AI巨擘,拥有令人惊叹的“火眼金睛”,能够为孩子们筛查包括心脏、基因、代谢等在内的多达32种疾病。 图源备注:图片由AI生成,图片授权服务商Midjourney想象一下,在与医生的对话中,CHANGE就像一位不知疲倦的超级助手。
3/19/2025 3:48:00 PM
AI在线
Grok 悄悄支持 Deeper Search,但马斯克及 xAI 没有任何宣发
从功能定位来看,Deeper Search 是此前 Deep Search 的升级版,相比 Deep Search 可实现“更深度”的搜索功能。
3/19/2025 3:08:21 PM
问舟
直通戛纳!即梦AI启动“未来影像计划・AI科幻短片征集”活动
3月17日,字节跳动旗下AI创意和内容平台即梦AI,正式启动“未来影像计划・AI科幻短片征集”活动。 该活动旨在借助AI技术,推动科幻电影创作发展。 值得关注的是,优秀作品将直通第78届法国戛纳电影节科幻电影国际峰会,主创团队也有机会在峰会上与国际知名科幻导演、制片人交流。
3/19/2025 3:07:00 PM
新闻助手
谷歌为Gemini AI添加Canvas协作空间和音频转换功能
谷歌近日为其Gemini人工智能助手推出了两项重要新功能:Canvas协作工作空间和Audio Overviews音频概览,进一步增强了其AI助手的实用性和用户体验。 Canvas:实时协作文档创建Canvas功能为用户提供了一个交互式工作区,使用户能够与AI协作创建文档和代码。 该功能支持实时显示更改,并通过集成的聊天界面让用户讨论修改内容。
3/19/2025 3:04:00 PM
AI在线
全美高校掀起 AI 作弊风暴:近 50% 大学生用 ChatGPT 拿高分,OpenAI 私藏检测工具
ChatGPT 竟成为美国学生作弊的「黑科技」,而 OpenAI 为了市场占有率,暗藏 ChatGPT 文本识别工具!
3/19/2025 2:50:40 PM
清源
超 400 位明星签署联名信:反对 OpenAI 和谷歌随意使用版权内容训练 AI
超过400名娱乐行业明星签署联名信,强烈反对OpenAI和谷歌使用版权内容训练AI模型。信中强调,AI公司应依法与版权所有者协商授权,不应削弱版权保护。去年好莱坞明星曾支持加州AI安全法案,但被否决。#AI版权争议# #OpenAI#
3/19/2025 2:48:11 PM
远洋
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
人形机器人
Transformer
百度
AI视频
苹果
深度学习
模态
xAI
字节跳动
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
视觉
科技
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练