资讯列表
OpenAI o3 AI 模型突破推理极限背后:成本飙升,没“钞能力”用不起
科技媒体 TechCrunch 昨日(12 月 23 日)发布博文,认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩,但背后的高计算成本,让其短期内很难在实际应用中普及。
使用LLaMA 3.1、Firebase和Node.js,构建一个音控的智能厨房应用程序
译者 | 布加迪审校 | 重楼这篇指南逐步介绍了创建一个自动化的厨房助理的过程,附有语音命令、实时购物清单管理以及食谱建议。 我在本教程中将介绍创建一个智能厨房应用程序(Chent),它可以根据个性化偏好简化杂货清单管理。 该应用程序通过语音命令操作,简化了人机交互和添加商品。
使用 MediaPipe 检测面部五官
面部识别和检测已成为许多现代应用中不可或缺的组成部分,包括用于设备解锁和社交媒体应用中实时效果的添加。 然而,准确高效地检测面部特征,包括鼻子、嘴巴、眼睛甚至虹膜,可能是一个挑战性的过程。 幸运的是,由Google开发的开源框架MediaPipe提供了一个解决方案,它提供了强大的预训练机器学习模型,允许开发者以高精度跟踪和分析面部标志点。
消息称 Meta 将推出带屏幕的智能眼镜,最早明年下半年发布
据英国《金融时报》今日报道,市值1.5万亿美元(当前约 10.94 万亿元人民币)的Meta正与眼镜集团EssilorLuxottica合作,计划在其售价300美元(当前约 2188 元人民币)的太阳镜中加入显示屏。
全大核配置:天玑8400移动芯片正式发布,红米Turbo 4将首发
目前,全球已有近亿台设备搭载了天玑 8000 系列芯片。
谷歌前 CEO 施密特:若 AI 开始自我改进,我们应“认真考虑”暂停它
施密特预测,AI将从特定任务助手逐渐发展为能够独立决策的复杂系统。当AI发展到这种程度时,人类就应介入并考虑关闭系统,施密特指出。人类还需要确保AI无法反制关闭系统的努力。
市场份额稳居前三!商汤智算服务持续领跑
国际权威咨询机构IDC近日发布《中国智算服务市场(2024上半年)跟踪》报告。 报告显示,2024年上半年,商汤科技作为国内领先的智算服务商,以13.3%的市场份额稳居GenAI IaaS市场Top3,位列GenAI IaaS领域第一梯队。 Gen AI驱动,商汤站稳智算市场头部阵营2024上半年中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。
马斯克 xAI 聊天机器人 Grok 推出独立 iOS 应用,在澳大利亚等国测试
这款应用在澳大利亚及部分国家处于测试阶段,能够实时获取来自网络和 X 的数据,并提供多种生成式 AI 功能,包括重写文本、总结长篇段落、简单的问答功能,还可根据文字提示生成图像。
韩国科研人员开发出可穿戴机器人:帮助截瘫用户行走、越障、爬楼梯
这款名为WalkON Suit F1的动力外骨骼由铝和钛合金材料制成,重达50公斤,由12个电机驱动,可以模拟人的关节动作来实现行走。
罗永浩最后一次创业最新进展:暂别 AR,迎来 AI Jarvis
按照计划,细红线将在蛇年春节前后发布首款新品,据了解,这个新品的主菜是软件方案,并附带了一款 AI native 硬件,“理念非常超前”,一位内部员工如是认为。不过内部对于这款产品的销量暂不抱期待,“新事物往往没有可参照对象”。
火山引擎论文入选国际会议ACM MM'24|对齐人类主观偏好的图像质量评价方法
会议背景2024年10月28日至11月1日,ACM Multimedia(ACM MM) 2024在澳大利亚墨尔本召开,该会议是中国计算机学会(CCF)推荐的多媒体领域的A类国际学术会议。 2024年共4395篇参与审稿,最终录用1149篇论文,录用率26.1%。 火山引擎-流媒体技术与湖南工商大学、湘江实验室合作的论文"Align-IQA: Aligning Image Quality Assessment Models with Diverse Human Preferences via Customizable Guidance" 被ACM Multimedia 2024 收录。
ABCoder 在大模型编程领域的探索
前言大语言模型(以下简称大模型或 LLM) 真正意义上火出圈,应该算是 OpenAI 发布 ChatGPT 后(22 年底)。 从这个时间开始,到现在为止,已经过了很长一段时间了,市面上也出现了一些编程工具,比如 MarsCode、Copilot 或者 Cursor 等比较火的结合 IDE 的插件和工具。 而实际上:经过了这么长时间的 LLM 产品发展,大家的编程方式真的被改变了吗?
NeurIPS 2024 | 从单图到3D:HumanSplat 基于Gaussian Splatting实现高保真人体3D生成
在虚拟和增强现实中,构建写实风格的虚拟人体形象已成为实现自然交互和逼真体验的关键技术之一,并且在社交媒体、游戏、电商、远程交流等领域拥有广泛应用。 然而,现有的人体重建方法通常依赖大量的多视图图像输入或需要对每个实例进行耗时的优化处理,这不仅限制了其在实际场景中的适用性和效率,也难以满足快速和高质量建模的需求。 因此,仅从单张输入图像生成高保真度的人体模型仍然是一个充满挑战的课题。
时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025
多变量时间序列预测(MTSF)在金融投资、能源管理、天气预测和交通优化等领域具有重要应用。 然而,现实中的时间序列通常面临两大挑战:1. 时间模式的异质性,即由于外部因素的影响,真实时间序列往往表现出非平稳性(Temporal Distribution Shift, TDS),导致其分布和模式发生显著变化;2.
麦吉尔大学Ding Lab基于深度学习开发单细胞水平转座子位点表达定量模型,登Nature子刊
编辑丨ScineceAI该论文介绍 MATES:一种基于深度学习的单细胞水平转座子定量工具。 MATES 使用基于自编码器的模型,通过分析转座子区域周围独特比对读段的分布,概率性地将多重比对转座子读段分配到特定位点。 通过深度神经网络,MATES 学习独特读段分布与多重比对读段来自特定位点的可能性之间的关系。
ScienceAl 2024「AI+蛋白&核酸&分子互作」专题年度回顾
编辑 | 萝卜皮2024年,科学界迎来了重要的突破与创新,尤其是在人工智能与结构生物学的结合领域。 正如今年诺贝尔奖颁发所体现的那样,人工智能(AI)技术的迅猛发展正在推动各学科的深度融合,揭示了生命科学研究的新机遇与前景。 在这一年里,AI 与生物学的交汇点愈发引人注目,成为推动现代生物医药、医学研究、生命科学等领域变革的重要力量。
参加完NeurIPS,纽约大学教授感受到了AI博士生的焦虑与挫败
2024 年 12 月 10-15 日,今年度的 NeurIPS 已在加拿大温哥华成功举办。 今年的会议上,我们看到了 Ilya Sutskever 关于预训练即将终结的预测,也看到了引发广泛争议的 MIT 教授 NeurIPS 演讲公开歧视中国学生的事件。 该会议也展现了人工智能领域的研究盛况 —— 本届 NeurIPS 共收到 15671 篇有效论文投稿,比去年又增长了 27%,但最终接收率仅有 25.8%。
扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。 在官方截图中,中等o3-mini的性能和o1 mini差不多,价格却只有后者的一半,整体延迟也和GPT-4o相当。 最主要的,这表明了OpenAI可以在降低成本的同时提高性能。