应用

无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni，小巧全能，极速推理

无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni，小巧全能，极速推理

12月16日，无问芯穹宣布正式开源其“端模型端软件端IP”端上智能一体化解决方案中的小模型——全球首个端侧全模态理解开源模型Megrez-3B-Omni，并同步开源了纯语言版本模型Megrez-3B-Instruct。据介绍，Megrez-3B-Omni是一个为端而生的全模态理解模型，选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸，结构规整，推理速度最大领先同精度模型300%。作为一个全模态模型，Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力，并在三个模态的多种测评基准中取得了最优性能。

12/16/2024 2:26:00 PM

新闻助手

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

3 个月前，MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。只用了 5 周时间，海螺 AI 的网页版访问量便增速超 800%，还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。一时间，不少国内网友直呼其为“国产之光”。

12/16/2024 2:04:00 PM

郑佳美

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

无问芯穹今日宣布，开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。

12/16/2024 12:43:22 PM

沛霖（实习）

武汉大学人工智能学院成立，小米集团称期待合作

武汉大学人工智能学院成立，小米集团称期待合作

武汉大学人工智能学院今日揭牌成立，由中国科学院院士、武汉大学校长张平文教授担任首任院长。该学院将自 2025 年起在“人工智能”专业招收本科生，在“智能科学与技术”学科招收学术型硕士和博士研究生，在“电子信息”学科招收专业型硕士和博士研究生。

12/16/2024 12:24:47 PM

汪淼

对话肖特特：从伯克利到PromptAI创业，发明创造下一代视觉智能

对话肖特特：从伯克利到PromptAI创业，发明创造下一代视觉智能

通用语言模型率先起跑，但通用视觉模型似乎迟到了一步。究其原因，语言中蕴含大量序列信息，能做更深入的推理；而视觉模型的输入内容更加多元、复杂，输出的任务要求多种多样，需要对物体在时间、空间上的连续性有完善的感知，传统的学习方法数据量大、经济属性上也不理性...... 还没有一套统一的算法来解决计算机对空间信息的理解。

12/16/2024 11:00:00 AM

机器之心

Kimi 发布视觉思考模型 k1：试题拍照给出答题思考全过程

Kimi 发布视觉思考模型 k1：试题拍照给出答题思考全过程

月之暗面 Kimi 今日发布视觉思考模型 k1。该模型基于强化学习技术打造，原生支持端到端图像理解和思维链技术，并将能力扩展到数学之外的更多基础科学领域。

12/16/2024 9:48:10 AM

汪淼

工具大盘点！5款AI视频生成神器优缺点分析（附打分表）

工具大盘点！5款AI视频生成神器优缺点分析（附打分表）

24年初，Sora 爆红网络，随之大量的AI视频生成的产品趁势崛起。我们当时也做过相关产品的调研，并发布了文章11款AI视频生成神器优缺点分析。工具大盘点！

12/16/2024 12:13:49 AM

Infinite AI

哗然！MIT教授NeurIPS演讲公开歧视中国学生，大会官方认错、本人道歉

哗然！MIT教授NeurIPS演讲公开歧视中国学生，大会官方认错、本人道歉

正在加拿大温哥华举办的人工智能顶会 NeurIPS，竟然有学者在演讲中公开发表对中国学者的歧视言论。「我这样做是为了让我的论文结果看上去更好，我的学校里没有人教我们道德或价值观。 —— 现在已被顶尖大学开除的中国留学生的借口。

12/15/2024 10:21:00 PM

机器之心

高中生手机写出2.5万行代码的热门项目，GitHub 1900星，网友：给孩子捐个电脑

高中生手机写出2.5万行代码的热门项目，GitHub 1900星，网友：给孩子捐个电脑

「强者」小孩哥：其实我是要学医的。最近，有一个 GitHub 开源项目引发了众人的关注。这是一个名叫 markview.nvim 的插件，作为高度定制化的 Neovim markdown 预览器，Star 量已有 1900 个。

12/15/2024 10:17:00 PM

机器之心

OpenAI 联合创始人 Ilya Sutskever：预训练时代即将结束

OpenAI 联合创始人 Ilya Sutskever：预训练时代即将结束

继李飞飞、Bengio、何恺明之后，在刚刚的 NeurIPS 2024 中，Ilya Sutskever 最新演讲也来了。虽然时长仅有 15 分钟左右，但内容依旧看头十足。

12/15/2024 2:35:38 PM

远洋

Claude 3.5 编程收入暴增 10 倍，抢走 Cursor 反杀 OpenAI

Claude 3.5 编程收入暴增 10 倍，抢走 Cursor 反杀 OpenAI

成立仅三年，估值 180 亿美金 Anthropic 正义迅雷不及掩耳之势，一步步蚕食 OpenAI 市场份额。在过去 3 个月，他们编程收入暴增 10 倍，还抢走了最火的 Cursor，OpenAI 的高管们彻底坐不住了！

12/15/2024 1:14:41 PM

远洋

无人机：不是我想长腿，《Nature》论文说这样更省力

无人机：不是我想长腿，《Nature》论文说这样更省力

「这世界上有一种鸟是没有脚的，它只能一直飞，飞累了就睡在风里，这种鸟一辈子只能下地一次......」这种神奇的无脚鸟，是王家卫在《阿飞正传》中留下的经典意象，也是这部电影最触人心弦的隐喻。而在现实世界中，「无人机」应该算是最接近无脚鸟的存在。但却有这么一个研究团队，非要给「无脚鸟」装上脚。

12/14/2024 11:20:00 PM

机器之心

腾讯微信正式发布多模态大模型 POINTS 1.5

腾讯微信正式发布多模态大模型 POINTS 1.5

据官方介绍，这一代 POINTS 模型，不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想，同时极大了增强了模型的性能。

12/14/2024 7:02:05 PM

问舟

阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”

阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”

Step-1o 支持语音、文本等混合形式的输入和输出，可以快速反应并随时打断，它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。

12/14/2024 5:44:41 PM

浩渺

AMD 苏姿丰：12 个月后的 AI 将比现在更惊人，至少有 10 倍进步

AMD 苏姿丰：12 个月后的 AI 将比现在更惊人，至少有 10 倍进步

尽管人工智能目前仅处于“非常非常初期”的阶段，但她仍作出大胆预测：12个月后，它将比现在更加惊人，至少会有10倍的进步。

12/14/2024 4:09:20 PM

清源

26 岁 OpenAI“吹哨人”Suchir Balaji 自杀身亡，曾质疑 ChatGPT 版权问题

26 岁 OpenAI“吹哨人”Suchir Balaji 自杀身亡，曾质疑 ChatGPT 版权问题

据《印度快报》今日报道，印度裔美国人、前 OpenAI 研究员 Suchir Balaji 于 11 月 26 日在旧金山的公寓中去世，法医判定死因自杀，未发现外部侵害迹象。

12/14/2024 2:02:35 PM

清源

共建多元化 AI 数据生态：微软携手哈佛、OpenAI 等组织，消除 AI 偏见

共建多元化 AI 数据生态：微软携手哈佛、OpenAI 等组织，消除 AI 偏见

微软正与非营利组织、大学、政府、OpenAI 等科技公司合作，参与哈佛法学院图书馆的机构数据倡议（IDI）和英国开放大学主导的 CORE 项目，从而增加公众可访问的数据量，提升数据来源、文化、语言和主题的多样性，最终惠及所有人。

12/14/2024 11:46:52 AM

故渊

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

“360 智脑”官方公众号昨日（12 月 13 日）发布博文，宣布推出 360 自研 AI 大模型 360gpt2-o1，推理能力显著提升，在数学和逻辑推理任务上表现出色。

12/14/2024 10:43:50 AM

故渊

资讯热榜

AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna 纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相基于MiniO存储的RAGFlow+Dify图片处理方案

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion Gemini 马斯克算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习 xAI 模态字节跳动大语言模型 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力安全视觉视频生成干货合集应用大型语言模型科技亚马逊训练特斯拉 AGI DeepMind