资讯列表

分类

标签

豆包视觉理解模型惊艳亮相：首次评测就排名全球第二

12 月 18 日-19 日，火山引擎 FORCE 原动力大会・冬正式在上海举行。本次大会最引人关注的看点，无疑就是豆包大模型家族的全线升级，以及全新豆包视觉理解模型的发布

12/23/2024 2:50:02 PM

汐元

o3并非独门秘技，谷歌已发背后关键机制，方法更简单、成本更低

o1/o3带火的推理计算Scaling，原来谷歌早在今年8月就曾探讨过。当时，来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。他们发现小模型通过生成多种答案/样本，其任务表现可能比一些大型模型单次尝试还要好。

12/23/2024 2:30:00 PM

量子位

使用GenAI实现缺陷检测和分析

如果制造公司能够在缺陷发生时就准确找出原因，从而避免代价高昂的生产延误并确保一流的质量，那会怎样？生成式人工智能（GenAI）彻底改变了制造商的质量控制和缺陷监控方式，使之成为可能。通过GenAI，制造企业就可以进行持续的缺陷监控和根本原因分析（RCA），从而进行实时质量控制，确保更高效、更可靠的生产运营。

12/23/2024 2:12:41 PM

Rajat Jain

尽管AI和分析技术得到广泛使用，但许多企业的数据治理仍不到位，这在网络安全和合规性等多个层面都存在风险，更不用说对各种利益相关者的潜在影响了。简而言之，随着企业对数据的依赖程度不断增加，数据治理变得越来越必要，而非减少。 Info-Tech Research Group负责数据、分析、企业架构和AI的首席研究总监Steve Willis提供了一个令人清醒的统计数字：大约50%至75%的数据治理计划都失败了。

12/23/2024 1:55:34 PM

Lisa Morgan

麻省理工研究人员提高机器学习模型准确性

机器学习（ML）有可能通过利用大量数据进行预测洞察来改变医疗决策。然而，当这些模型在不能充分代表所有人口群体的数据集上进行训练时，就会出现一个严重挑战。预测疾病患者治疗计划的模型可以在主要包含男性患者的数据集上进行训练。

12/23/2024 1:28:22 PM

AI情报室

微调 YOLO 做车辆、人员、交通标志检测 | 附代码+数据集

目标检测在计算机视觉中是一个至关重要的任务，而YOLO（You Only Look Once）因其速度和准确性而脱颖而出。在本指南中，我将带你了解如何微调一个YOLO模型，以检测各种道路标志和物体，例如：车辆行人不同颜色的交通灯人行横道速度限制标志禁止标志警告标志本指南适用于使用Linux的用户。对于Windows用户，Poetry和Cuda的安装可能会有所不同。

12/23/2024 1:10:00 PM

二旺

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

这段时间，OpenAI 宣告连续 12 轮轰炸，让 2024 年底的大模型领域热闹起来了。但坚持每个凌晨看直播的话会发现，越到后面的发布越平淡，内心的波动也越少了。今年的大模型就卷到这里了吗？

12/23/2024 1:06:00 PM

机器之心

李飞飞、谢赛宁等探索MLLM「视觉空间智能」，网友：2025有盼头了

希望 2025 年 AI 领域能带来推理之外的突破。在购买家具时，我们会尝试回忆起我们的客厅，以想象一个心仪的橱柜是否合适。虽然估计距离是困难的，但即使只是看过一次，人类也能在脑海里重建空间，回忆起房间里的物体、它们的位置和大小。

12/23/2024 12:59:00 PM

机器之心

剖析BadGPT-40背后的真相：一个从GPT模型中移除护栏的模型

译者 | 晶颜审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型（LLM）风靡全球。从通用的智能助手到代码伙伴，这些模型似乎什么都能做——除了可靠地执行其内置的安全准则。 OpenAI等公司安装的广为人知的“护栏”旨在确保负责任的行为，保护用户免受恶意输出、虚假信息和网络利用企图的影响。

12/23/2024 12:52:29 PM

晶颜

2024亚马逊研究奖获奖名单：张崇杰、魏华等人入选

上周五，亚马逊研究奖（Amazon Research Awards，ARA）公布了最新一期来自 10 所大学的 10 名获奖者。亚马逊研究奖于 2015 年设立，旨在为多学科研究主题的研究人员提供资助奖励。获奖者可以访问 300 多个亚马逊公共数据集，并可以通过促销积分使用 AWS AI/ML 服务和工具。

12/23/2024 12:50:00 PM

机器之心

AAAI 2025｜时间序列演进也是种扩散过程？基于移动自回归的时序扩散预测模型

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

12/23/2024 12:47:00 PM

机器之心

图学习新突破：一个统一框架连接空域和频域

12/23/2024 12:42:00 PM

机器之心

李飞飞谢赛宁新作「空间推理」：多模态大模型性能突破关键所在

李飞飞谢赛宁再发新成果：直接把o1式思考拉至下一个level——多模态大语言模型的空间思维！这项研究系统评估了多模态大模型的视觉空间智能，结果发现：当前，即使是最先进的多模态大模型，在空间认知方面与人类相比仍有显著差距，测试中约71%的错误都源于空间推理方面的缺陷，即空间推理能力是当前主要瓶颈。图片更为有趣的是，在这种情况下，思维链、思维树等常用的语言提示技术直接失灵了——不仅没有提升模型在空间任务上的表现，反而会使性能下降。

12/23/2024 12:37:34 PM

雷军在线挖人，传年薪千万级！DeepSeek 关键骨干罗福莉已离职加入小米，或领军小米大模型团队；小米将在大模型上奋起直追！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）AI圈的大新闻，雷总在线挖人，小米要发力大模型了！知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。而且雷总已经初战告捷——帮小米赢得了DeepSeek的关键骨干罗福莉。

12/23/2024 12:33:42 PM

伊风

大模型检索增强生成之向量数据库的问题

作为技术人员我想大家或多或少应该都接触过数据库技术，数据库技术的历史可以说是由来已久了；但数据库的发展也是一路曲折，特别是随着互联网体量的快速增加，对数据库的要求也变得越来越多。而且为了适应各种不同的业务场景，数据库系统也是紧跟潮流发展出多种类型的数据库；比如说传统的关系型数据库，缓存数据库，以及大数据处理的数据库；直到今天的向量数据库。关系型和缓存数据库就不用说了，今天我们就来聊聊向量数据库系统。

12/23/2024 11:31:05 AM

DFires

百川智能发布全链路领域增强金融大模型 Baichuan4-Finance，测试成绩领先 GPT-4o

百川智能今日发布全链路领域增强金融大模型 Baichuan4-Finance，融合 100B + 中英文金融知识，采用多层次质量评估体系进行筛选，由人民大学财政金融学院金融专家团队全程参与定义和评估。

12/23/2024 11:25:24 AM

汪淼

全球首个AI圣彼得大教堂上线，40万照片毫米级3D还原文艺复兴巅峰！

不用排队、不用签证，现在只需打开屏幕，就能探索圣彼得大教堂的一切——从壮美的圆顶到鲜有人见的教皇墓地，全方位感受这座文艺复兴与巴洛克建筑巅峰之作的震撼。梵蒂冈联手Iconem和微软，仅用不到一个月的时间，就打造了这座教堂的数字双胞胎，并推出沉浸式展览和互动网站——La Basilica di San Pietro（意大利语：圣彼得大教堂）。探索地址：，圣彼得大教堂见证了米开朗基罗与贝尔尼尼的建筑天才。

12/23/2024 10:50:00 AM

新智元

百川行业首创领域自约束训练方案，Baichuan4-Finance金融场景能力领先GPT-4o近20%

12 月 23 日，百川智能发布全链路领域增强大模型 Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创的领域自约束训练方案，Baichuan4-Finance 实现了金融能力和通用能力同步提升的效果，极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力大幅领先 GPT-4o，在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内主流开源金融评测基准 FinancelQ 上均登上榜首。

12/23/2024 10:34:00 AM

新闻助手

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 AI视频资讯早读！7个产品更新+8个案例精选 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集训练应用大型语言模型科技亚马逊 DeepMind 特斯拉智能体

资讯列表

豆包视觉理解模型惊艳亮相：首次评测就排名全球第二

o3并非独门秘技，谷歌已发背后关键机制，方法更简单、成本更低

使用GenAI实现缺陷检测和分析

企业为何仍挣扎于数据治理：挑战与破局之道

麻省理工研究人员提高机器学习模型准确性

微调 YOLO 做车辆、人员、交通标志检测 | 附代码+数据集

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

李飞飞、谢赛宁等探索MLLM「视觉空间智能」，网友：2025有盼头了

剖析BadGPT-40背后的真相：一个从GPT模型中移除护栏的模型

2024亚马逊研究奖获奖名单：张崇杰、魏华等人入选

AAAI 2025｜时间序列演进也是种扩散过程？基于移动自回归的时序扩散预测模型

图学习新突破：一个统一框架连接空域和频域

李飞飞谢赛宁新作「空间推理」：多模态大模型性能突破关键所在

雷军在线挖人，传年薪千万级！DeepSeek 关键骨干罗福莉已离职加入小米，或领军小米大模型团队；小米将在大模型上奋起直追！

大模型检索增强生成之向量数据库的问题

百川智能发布全链路领域增强金融大模型 Baichuan4-Finance，测试成绩领先 GPT-4o

全球首个AI圣彼得大教堂上线，40万照片毫米级3D还原文艺复兴巅峰！

百川行业首创领域自约束训练方案，Baichuan4-Finance金融场景能力领先GPT-4o近20%