资讯列表

分类

标签

将目标检测模型导出到C++|RT-DETR、YOLO-NAS、YOLOv10、YOLOv9、YOLOv8

最近，出现了更新的YOLO模型，还有RT-DETR模型，这是一个声称能击败YOLO模型的变换器模型，我想将这些模型导出并进行比较，并将它们添加到我的库中。在这篇文章中，我将带你了解如何将这些模型导出到ONNX并运行它们，然后最终比较这些模型的速度。将RT-DETR模型导出到ONNX这是从模型的GitHub页面获取的模型示例输出为了导出模型，我们需要从模型的GitHub仓库克隆代码（）。

12/20/2024 2:32:54 PM

二旺

Grammarly 收购 AI 公司 Coda，将为企业推出大模型 LLM 助手 / 语法检查工具

IT之家的小伙伴们可能有用过 Grammarly 工具提供的“语法检测”服务，这一工具对于英文书信等场合较为友好，而根据 Grammarly 官方新闻稿，该公司现已收购一家 AI 初创公司 Coda，将涉足 AI 生产力领域。Grammarly 表示，此次收购旨在整合双方的技术资源，该公司计划在内部通过结合 Coda 的 AI 工具和界面，转型为全面的“AI 生产力平台”，为企业提供生成式 AI 助手和各种生产力工具。

12/20/2024 2:03:39 PM

漾仔

马斯克明显是个恶霸！不会完全放弃非营利性质！奥特曼罕见采访曝猛料：马斯克喜欢到处干架，过去骂盖茨、扎克伯格，现在轮到我了

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）震惊了！家人们。在马斯克今天第四次诉讼OpenAI，阻止后者向盈利公司转型时。

12/20/2024 1:53:57 PM

伊风

UniReal登场：用视频架构统一图像生成与编辑，还学到真实世界动态变化规律

论文一作陈汐，现为香港大学三年级博士生，在此之前本科硕士毕业于浙江大学，同时获得法国马赛中央理工双硕士学位。主要研究方向为图像视频生成与理解，在领域内顶级期刊会议上发表论文十余篇，并且 GitHub 开源项目获得超过 5K star.本文中，香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中，通过将不同类别和数量的输入/输出图像建模为视频帧，从大规模真实视频数据中学习属性、姿态、光照等多种变化规律，从而实现高保真的生成效果。

12/20/2024 1:50:00 PM

机器之心

图森未来陈默：自动驾驶无以为继，急转驶入AIGC游戏，已拿下金庸群侠传、三体IP | 智者访谈

人工智能的卓越发展源于对技术与产业本质的洞察AI在线视频栏目「智者访谈」邀请领域专家，洞悉 AI 核心趋势深化行业认知，激发创新思考与智者同行，共创 AI 未来自动驾驶行业正经历新一轮洗牌。其中，全球自动驾驶第一股图森未来的沉浮，折射出整个行业的阵痛：从 2021 年 IPO 时 85 亿美元的估值，到 2024 年初退市，短短三年间历经管理层动荡、美国监管调查、业务收缩及大幅裁员等一系列剧变。退市之后，转折仍在继续：2024 年 8 月，公司出人意料地宣布进入生成式 AI 应用领域，计划打造基于《三体》的动画电影及视频游戏。

12/20/2024 1:48:00 PM

机器之心

美国佛罗里达州启用 AI 紧急广播系统 BEACON，利用大模型高效整合准确翻译灾情警报

美国佛罗里达州宣布正式启用全美首个 AI 紧急广播系统 BEACON，该系统主要作用就是利用 AI 整合处理各项灾情公告，并将官方公告准确翻译为多种语言，避免人工翻译可能带来的错误和延误。

12/20/2024 1:43:16 PM

漾仔

推理最强也最快，谷歌发布Gemini 2.0 Flash Thinking，全面超越o1-preview

不仅能推理，还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声，但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking，谷歌端上来的菜真是一道比一道香。

12/20/2024 1:41:00 PM

机器之心

出手即王炸？照片级真实度生成式世界模型，还获得皮克斯和Jeff Dean投资

世界模型正在爆发！近段时间，世界模型的相关研究成果正如雨后春笋版不断涌现，光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。事实上，在 Genesis 开源发布的差不多时间，一家名为 Odyssey 的创业公司也向世界介绍了他们的世界模型 Explorer。

12/20/2024 1:36:00 PM

机器之心

智源发布FlagEval「百模」评测结果，丈量模型生态变局

2024 年 12 月 19 日，智源研究院发布并解读国内外 100 余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。相较于今年 5 月的模型能力全方位评估，本次智源评测扩展、丰富、细化了任务解决能力内涵，新增了数据处理、高级编程和工具调用的相关能力与任务；首次增加了面向真实金融量化交易场景的应用能力评估，测量大模型的收益优化和性能优化等能力；首次探索基于模型辩论的对比评估方式，对模型的逻辑推理、观点理解、语言表达等核心能力进行深入分析。智源评测发现，2024 年下半年大模型发展更聚焦综合能力提升与实际应用。

12/20/2024 1:20:00 PM

机器之心

AI 的“心智理论”难题：Meta ExploreToM 探索突破之路

Meta 公司携手华盛顿大学和卡内基梅隆大学，组建科研团队，合作开发了 ExploreToM 框架，旨在更有效地评估和训练大语言模型（LLM）的心智理论（Theory of Mind，ToM）能力。

12/20/2024 12:31:25 PM

故渊

Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B

虽然语言和图像语言建模进展迅速，但视频多模态大模型（LMM）却难以望其项背。近日，Meta和斯坦福大学的团队联手，从评估基准、模型设计到开源模型, 做出了全方位的探索，创建ApolloBench用于解决视频理解领域评估效率低下的问题, 提出了模型设计的拓展一致性，发现了驱动LMM性能的关键因素，开源了Apollo模型。值得注意的是，Apollo-3B超越了几乎所有的7B模型，而Apollo-7B变体则是7B模型中目前最佳的。

12/20/2024 12:30:00 PM

新智元

刚刚，OpenAI元老级研究员Alec Radford离职，他主导了GPT-1、GPT-2的研发

OpenAI 连续 12 天发布会还剩最后一天，期待中的「重磅」迟迟没来，反而失去了一位核心研究人员。 OpenAI 人事方面的变动还在继续。今日，据外媒 The Information 报道，OpenAI 元老级人物 Alec Radford 即将离职，离职后进行独立研究。

12/20/2024 12:04:00 PM

机器之心

发现高能钠离子电池成分，机器学习简化最佳材料搜索过程

编辑 | KX锂离子电池广泛用于电动汽车、笔记本电脑、智能手机等电子产品。尽管锂离子电池在市场中占据着主导地位，但锂元素相对稀缺且昂贵。钠离子电池以钠离子作为能量载体，由于钠资源丰富、安全性高、成本低，有望成为 LIB 的替代品。

12/20/2024 11:54:00 AM

ScienceAI

释放数字金融向新力，奇富科技金融AI大模型成果落地上海金融科技国际论坛特展周活动

12 月 19 日，在第六届上海金融科技国际论坛之“2024年度人工智能大模型金融领域示范场景及创新应用案例成果特展”活动周上，由上海金融科技产业联盟创新监管联合实验室指导，奇富科技主办的“攻坚金融科技创新与大模型应用、释放数字金融向新力” 主题成果展在沪举办，全面展示了奇富科技在金融科技领域的创新实践。同时，上海金融科技产业联盟创新监管实验室与奇富科技现场达成创新伙伴合作，双方将共同探索金融科技创新的路径，推动新技术在金融领域高效、安全的应用，助力上海全球金融科技中心建设。奇富科技CEO吴海生在特展现场强调，科技是驱动金融创新的关键，能打破传统边界，以智能化、个性化方案满足多元化金融需求。

12/20/2024 11:49:00 AM

新闻助手

突发！GPT论文一作Alec Radford离职，前两代GPT作者全部离开OpenAI

OpenAI又跑了一名大神！ The Information消息，初代GPT论文第一作者Alec Radford也要离开OpenAI，转向独立研究。据了解， Alec于2016年加入OpenAI，从初代GPT到GPT-4o的论文中全都有他的名字，其中前两代还是第一作者。

12/20/2024 11:41:52 AM

量子位

2025英伟达奖学金名单公布，6位华人入选！中科大浙大校友在列，人均6万美元

刚刚，备受期待的英伟达2025-2026年度博士奖学金出炉了！该奖学金计划已经累计开展了二十多年，一直支持着从事与英伟达技术相关杰出工作的研究生。前几年还是每人5万美元，而今年随着风生水起的英伟达市值节节攀高，博士奖学金计划也跟涨20%，每位获选者都可以拿走6万美元！

12/20/2024 11:31:53 AM

新智元

一键生成万字专利！中科院发布多智能体框架AutoPatent，含1933个「草稿-专利」数据对

在科技日新月异的今天，专利作为保护创新成果的重要法律工具，其撰写过程却往往繁琐且耗时，传统的专利撰写工作通常由熟悉专利法律和技术领域的专利代理人完成，这一过程耗时费力，且效率较低。因此，开发一种能够自动化生成高质量专利文档的方法，对于提高专利撰写的效率和准确性具有重要意义。最近，来自中科院深圳先进院和大连理工大学的研究团队联合开发了一个名为AutoPatent的自动化的多智能体专利生成框架，能够在十分钟左右的时间依据发明人的专利技术底稿生成一篇完整的专利文档。

12/20/2024 11:15:25 AM

新智元

美国哥伦比亚大学研究：大语言模型正在变得越来越像人类大脑

哥伦比亚大学和费因斯坦医学研究所的研究团队近期进行了一项研究，探索了LLM与大脑神经反应的相似性。研究表明，随着LLM技术的进步，这些模型不仅在性能上有所提升，而且结构上也越来越接近人类大脑。

12/20/2024 10:18:16 AM

清源

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Ollama 支持全线的 Qwen 3 模型纳米AI发布MCP万能工具箱，简化AI工具集成与调用 AI视频资讯早读！7个产品更新+8个案例精选 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集训练应用大型语言模型科技亚马逊 DeepMind 特斯拉智能体