模型

AI能传递气味了！能定制个性化气味，谷歌前研究员新技术
继视觉和听觉之后，AI已经进化到拥有嗅觉了？？你没听错，这是来自Osmo公司的最新技术，它们刚刚首次实现了由AI生成的李子味道。
理论
- 977
- 0
量子位12月20日
1万人研究证实：玩游戏提升智力，与遗传/经济水平都无关
电子游戏可以提升智力，有正经科学研究支持了！来自阿姆斯特丹自由大学团队的一项新研究显示，在电子游戏上花费时间更多的儿童，2年后智力提升最多！他们深入分析了近1万名9-10岁的美国儿童，2年后又进行了回访。
理论
- 981
- 0
量子位12月20日
将目标检测模型导出到C++|RT-DETR、YOLO-NAS、YOLOv10、YOLOv9、YOLOv8
最近，出现了更新的YOLO模型，还有RT-DETR模型，这是一个声称能击败YOLO模型的变换器模型，我想将这些模型导出并进行比较，并将它们添加到我的库中。在这篇文章中，我将带你了解如何将这些模型导出到ONNX并运行它们，然后最终比较这些模型的速度。将RT-DETR模型导出到ONNX这是从模型的GitHub页面获取的模型示例输出为了导出模型，我们需要从模型的GitHub仓库克隆代码（）。
理论
- 976
- 0
二旺12月20日
UniReal登场：用视频架构统一图像生成与编辑，还学到真实世界动态变化规律
论文一作陈汐，现为香港大学三年级博士生，在此之前本科硕士毕业于浙江大学，同时获得法国马赛中央理工双硕士学位。主要研究方向为图像视频生成与理解，在领域内顶级期刊会议上发表论文十余篇，并且 GitHub 开源项目获得超过 5K star.本文中，香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中，通过将不同类别和数量的输入/输出…
理论
- 974
- 0
机器之心12月20日
智源发布FlagEval「百模」评测结果，丈量模型生态变局
2024 年 12 月 19 日，智源研究院发布并解读国内外 100 余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。相较于今年 5 月的模型能力全方位评估，本次智源评测扩展、丰富、细化了任务解决能力内涵，新增了数据处理、高级编程和工具调用的相关能力与任务；首次增加了面向真实金融量化交易场景的应用能力评估，测量大模型的收益优化和性能优化等能力；首次探索基于…
理论
- 976
- 0
机器之心12月20日
Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B
虽然语言和图像语言建模进展迅速，但视频多模态大模型（LMM）却难以望其项背。近日，Meta和斯坦福大学的团队联手，从评估基准、模型设计到开源模型, 做出了全方位的探索，创建ApolloBench用于解决视频理解领域评估效率低下的问题, 提出了模型设计的拓展一致性，发现了驱动LMM性能的关键因素，开源了Apollo模型。值得注意的是，Apollo-3B超越了几乎所有的7B模型，而Apollo-7…
理论
- 975
- 0
新智元12月20日
耗时缩短十倍以上，大规模AI方法加速原子模拟进程，推动更泛用的策略发展
编辑丨&扩展一直是提高机器学习各个领域的模型性能和泛化的关键因素。尽管在扩展其他类型的机器学习模型方面取得了成功，但对神经网络原子间电位（NNIP）扩展的研究仍然有限。该领域的主要范式是将许多物理域约束合并到模型中，例如旋转等方差等对称性约束。
理论
- 973
- 0
ScienceAI12月20日
突发！GPT论文一作Alec Radford离职，前两代GPT作者全部离开OpenAI
OpenAI又跑了一名大神！ The Information消息，初代GPT论文第一作者Alec Radford也要离开OpenAI，转向独立研究。据了解， Alec于2016年加入OpenAI，从初代GPT到GPT-4o的论文中全都有他的名字，其中前两代还是第一作者。
理论
- 978
- 0
量子位12月20日
六大数据集全部SOTA！最新DriveMM：自动驾驶一体化多模态大模型（美团&中山大学）
写在前面 & 笔者的个人理解近年来，视觉-语言数据和模型在自动驾驶领域引起了广泛关注。许多精心设计和标注的数据集用于微调多模态大模型，使模型不仅能理解视觉输入并生成文本回答，更能适用于自动驾驶多种应用场景。由于驾驶场景的复杂多变以及驾驶行为的多样性，现有的自动驾驶模型和数据往往专注于单一场景和任务。
理论
- 980
- 0
Zhijian Huang等12月20日
突破自动驾驶视频生成极限：港中文&港科大&华为联手推出MagicDriveDiT
可控视频生成，对于自动驾驶技术而言，同样非常重要。比如，生成高质量、长时间且可控的高质量街景视频，可以满足开发自动驾驶应用的数据缺口。现在，香港中文大学、香港科技大学和华为联手向这一长期挑战发起了冲锋：推出MagicDriveDiT，重新定义自动驾驶视频生成的标准。
理论
- 975
- 0
量子位12月20日
不会代码的独立开发者，除了学Cursor，还该会些什么？
“十多年前有本书叫《人人都是产品经理》，但现在可能才真正到了「人人都是产品经理」的时刻。 ”苹果商店付费榜Top1，这是一个不会代码的独立开发者用Cursor开发App的最佳战绩。背后独立开发者用1.5个小时，开发并上架了包括「小猫补光灯」在内的2款iOS App，这个初代版本最高冲到了苹果商店“摄影与录像分类”免费排行榜前20。
理论
- 979
- 0
量子位12月20日
Mac版ChatGPT接入大量应用，但终极大招在明天
今天是 ChatGPT 产品发布会第11天。现场的 OpenAI 产品负责人 Kevin Wheel 和他两位同事为我们揭晓 ChatGPT 在MAC端的最新进展，主要涉及编程和写作1. ChatGPT 桌面版的诞生Kevin 一上来就提到，过去半年，OpenAI 对桌面端应用下了大功夫。
理论
- 977
- 0
AI寒武纪12月20日
腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频
提速8倍！速度更快、效果更好的混元视频模型——FastHunyuan来了！新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。
理论
- 977
- 0
量子位12月20日
对齐、生成效果大增，文本驱动的风格转换迎来进阶版
论文的第一作者是来自西湖大学的研究人员雷明坤，指导老师为西湖大学通用人工智能（AGI）实验室的负责人张驰助理教授。实验室的研究方向聚焦于生成式人工智能和多模态机器学习。文本驱动的风格迁移是图像生成中的一个重要任务，旨在将参考图像的风格与符合文本提示的内容融合在一起，生成最终的风格化图片。
理论
- 976
- 0
机器之心12月19日
震惊！Claude伪对齐率竟能高达78％，Anthropic 137页长论文自揭短
今天，大模型公司 Anthropic 的一篇 137 页长论文火了！该论文探讨了大语言模型中的「伪对齐」，通过一系列实验发现：Claude 在训练过程中经常假装有不同的观点，而实际上却保持了其原始偏好。这一发现说明了大模型可能具备了类似于人类的属性与倾向。
理论
- 976
- 0
机器之心12月19日
更懂中文还兼顾SD生态，360开源文生图模型结构，寡姐秒变中国新娘
具备原生中文理解能力，还兼容Stable Diffusion生态。最新模型结构Bridge Diffusion Model来了。与Dreambooth模型结合，它生成的穿中式婚礼礼服的歪国明星长这样。
理论
- 973
- 0
量子位12月19日
GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了
新模型在MATH上（以数学竞赛为主）动辄跑分80%甚至90%以上，却一用就废。这合理吗？？
理论
- 974
- 0
量子位12月19日
沃顿商学院教授发文解析o1：能力仍有短板，「人机协同智能」或成AGI最重要难题
o1 preview问世3个月后，满血版的o1 Pro终于在上周以每月200美元的身价正式上线，奥特曼号称其为「当今世界上最智能的模型」。所以，这个正式的o1 Pro究竟强大到了什么程度？可以肯定的是，它远远不是一个走到AGI终点的灭霸，但这是scaling law之后的又一个里程碑吗？
理论
- 975
- 0
新智元12月18日
用上AI，升职提前4年？清华等分析6790万篇论文：科学界收缩，不用AI的领域无人问津
ChatGPT发布以来，各种大模型层出不穷，对各行各业的文字、脑力工作者来说绝对是一个效率神器，产出量大大提升。比如最近的研究成果，清华大学、芝加哥大学、Google的研究人员利用AI工具（模型性能F1值为0.876）分析了六大主要学科的6790万篇研究论文，结果发现，采用AI工具的科学家发表的论文数量增加了67.37%，获得的引用次数是未使用AI工具的科学家的3.16倍，并且还能提前4年成为团…
理论
- 976
- 0
新智元12月18日
ELMo模型可用于训练动态词向量，该模型有哪些优缺点？与BERT模型之间的区别是什么？｜深度学习｜大模型
ELMo（Embeddings from Language Models）是一种基于深度学习的动态词向量模型，它通过双向LSTM（长短期记忆网络）来生成词的表示，相较于传统的静态词向量方法，如Word2Vec和GloVe，ELMo能够根据上下文生成不同的词向量。这使得ELMo能够更好地处理同义词、歧义词以及多义词的上下文依赖关系，从而提升自然语言处理（NLP）任务的表现。然而，ELMo也存在一…
理论
- 975
- 0
亦然112月18日
智驾公司下场搞AI视频生成，模型上线即开源
AI好好用报道编辑：杨文人人免费可用。大洋彼岸，两大巨头 OpenAI 和谷歌轮番炸场。一个发布了那个传说中的 Sora，一个推出了最强视频生成模型 Veo2。
应用
- 977
- 0
AI好好用12月18日
Scaling Law撞墙？预训练终结？亚马逊云科技为什么还在做基础大模型
12 月 2-6 日，亚马逊云科技在美国拉斯维加斯举办了今年度的 re:Invent 大会。会上，亚马逊云科技发布了相当多东西，其中之一便是新的大模型系列 Nova。说实话，这确实出乎了相当多人的意料 —— 毕竟亚马逊已经重金押注 Anthropic，似乎没有必要再自起炉灶了。
理论
- 975
- 0
机器之心12月18日
见证历史！AI想的科研idea，真被人类写成论文发表了
天啦撸！！ AI想出来的idea，还真有人写成论文了。
理论
- 974
- 0
量子位12月18日
国产开源模型顶流「通义」，被曝应用团队已“离开”阿里云，并入阿里智能信息事业群！阿里吴嘉回归的第一把火，能燃起来吗？
编辑 | 伊风媒体爆料了阿里系大模型“通义”的大新闻：近期，AI应用“通义”已经从阿里云被分拆出来，并入到阿里智能信息事业群！乍一看有点懵，因为被分拆出来的不是全部的“通义”，而是 To C 的应用层“通义”。而模型层的“通义”大模型家族相关业务，仍然保留在阿里云体系内的通义实验室中。
理论
- 985
- 0
伊风12月18日