应用

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

LAMM (Language-Assisted Multi-Modal) 旨在建设面向开源学术社区的多模态指令微调及评测框架，其包括了高度优化的训练框架、全面的评测体系，支持多种视觉模态。ChatGPT问世以来，大语言模型（LLM）实现了跳跃式发展，基于自然语言进行人机交互的AI范式得到广泛运用。然而，人类与世界的交互中不仅有文本，其他诸如图片、深度等模态也同样重要。然而，目前的多模态大语言模型（MLLM）研究大多数闭源，对高校和大多数研究机构的同学们并不友好。而且，大语言模型受限于训练知识，往往缺乏时事认知、复杂

1/11/2024 10:38:00 AM

机器之心

GauHuman开源：基于Gaussian Splatting，高质量3D人体快速重建和实时渲染框架

南洋理工大学 - 商汤科技联合研究中心 S-Lab 团队提出了基于 Gaussian Splatting 的高质量 3D 人体快速重建 (1~2 分钟) 和实时渲染 (高达 189 帧每秒) 框架 GauHuman。GauHuman 可以基于用户输入的一段单目人体视频，以及相应的相机和人体动作体型（SMPL）参数，快速重建该 3D 人体，并实时渲染该 3D 人体。论文名称：GauHuman: Articulated Gaussian Splatting from Monocular Human Videos论文下载

1/11/2024 10:33:00 AM

机器之心

OPPO、锐思智芯、高通三方携手，共同推动智能手机影像AI Motion变革

2024年1月11日——OPPO，锐思智芯，高通近期发布，合作推动创新性融合视觉传感(Hybrid Vision Sensing，HVS®)技术在智能手机领域应用。通过HVS®传感器来更高效地提取运动信息和图像数据，从而帮助进一步改善拍照性能并实现影像的AI Motion功能。三方将合作开发一套完整方案，包括从Hybrid Vision Sensor获取原始视觉信息，传输至骁龙® 移动平台，并搭配专用算法。该合作方案将帮助实现智能手机影像创新功能，如拍照去模糊，超分辨率，和视频超慢动作重建等需要基于图像和运动信息结

1/11/2024 10:32:00 AM

视频一键转风格！详解AI视频神器 DomoAI 用法

大家好，这里是和你们一起探索 AI 的花生~ 之前为大家推荐过 Runway、Pika 等 AI 视频生成工具，今天我们继续了解一款新的 AI 视频工具 Domo AI。如果说 Runway 的特色是动态笔刷、Pika 的特色是视频局部重绘，那么 DomoAI 最厉害的就是它的视频转绘功能，可以把真人视频转为效果稳定的风格化视频，最近网上很多热门 AI 视频也都是用它生成的，今天就为大家详细介绍一下它的功能和用法。上期回顾:一、Domo AI 视频转绘官方 Discord 链接： DomoAI 的服务目前托管

1/11/2024 8:21:44 AM

夏花生

AI做内核，荣耀「魔法OS」要做手机系统第三极

用 AI 把操作系统重做一遍。在手机 OS 这个充满「微创新」的领域，终于有人拿出了不一样的东西。今天下午，荣耀揭幕了新一代系统 MagicOS 8.0（中文名：魔法 OS 8.0），通过全面 AI 化，让我们看到了未来人机交互该有的样子。搭载 MagicOS 8.0 的荣耀手机，展现出了一系列 AI 加持的新能力：如果你想剪视频，只需要跟智能助理说上几句，手机就可以自动从本机图库里选出你提到的人物、场景素材，剪辑好、加上配乐生成一段；短信通知的活动时间和地点，不需要费劲复制特定的文本，把对话气泡拖到屏幕边缘，系统

1/10/2024 5:32:00 PM

机器之心

英伟达CES三款芯片连发，市值暴涨超6%，AI PC时代来临

英伟达再次给我们带来了一点生成式 AI 的震撼。生成式 AI 是最前沿的科技发展方向之一，正在举行的消费电子大展 CES 2024 上，我们正在见证新变革的发生。昨天凌晨，英伟达在一场半小时的特别演讲中介绍了一系列 AI 加持的新技术，通过整个技术堆栈创新加速生成式 AI 在 AI PC 端落地。演讲结束后，NVIDIA 股价应声上涨超过 6%，领跑科技美股。今天更是持续上涨，市值突破 1.31 万亿美元。这一次，英伟达通过领先业界的理解，结合十几年的 AI 生态精心布局，真正实现了 AI PC 的落地，其发布的一

1/10/2024 5:27:00 PM

机器之心

翻车，才是斯坦福炒菜机器人学习人类的常态

Mobile ALOHA 也有翻车时刻。电视剧中角色的惊艳亮相不一定能打动你的心，但斯坦福全职管家兼御用大厨一定能拿下你对机器人的期待。你还记得斯坦福 Mobile ALOHA 的神操作吗？备菜、翻炒、出锅，洗衣、逗猫、浇花它是样样精通。不过它也并非一直如此优秀。人有失足，马有失蹄，ALOHA 也有翻车时刻。我们一起品鉴一下 ALOHA 的「报错」操作。原本是为了擦酒杯下的酒渍，或许是怕观众老爷看不出，只能多洒出来一点来引起注意。每个物品都是独立的个体，锅、油、虾、碟都将有属于自己的归宿。抓走物品旁边的空气，四舍五

1/10/2024 5:24:00 PM

李亚洲

Mixtral 8x7B论文终于来了：架构细节、参数量首次曝光

Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间，那个爆火整个开源社区的 Mixtral 8x7B MoE 模型论文放出了。此前，由于 OpenAI 团队一直对 GPT-4 的参数量和训练细节守口如瓶。Mistral 8x7B 的放出，无疑给广大开发者提供了一种「非常接近 GPT-4」的开源选项。要知道，很早之前就有人爆料，OpenAI 也是采用了「混合专家模型」（Mixture of Experts，MoE）的构架来搭建 GPT-4。随着论文的放出，一些研究

1/10/2024 5:16:00 PM

机器之心

比A100性价比更高！FlightLLM让大模型推理不再为性能和成本同时发愁

大语言模型在端侧的规模化应用对计算性能、能效比需求的“提拽式”牵引，在算法与芯片之间，撕开了一道充分的推理竞争场。面对想象中的终端场景，基于 GPU 和 FPGA 的推理方案的应用潜力需要被重新审视。近日，无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程，首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。第一作者为清华大学电子系博士及无问芯穹硬件负责人曾书霖，通讯作者为上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩，清华大学电子工程

1/10/2024 5:00:00 PM

李亚洲

钉钉×小冰：共同推出一键定制数字人，将在AI助理等领域全面合作

在1月9日举行的钉钉7.5产品发布会上，钉钉总裁叶军宣布，钉钉与小冰公司达成合作，共同推出一键定制数字人服务。钉钉已接入小冰数字人，用户可通过钉钉发放的邀请码免费参与数字人内测，在钉钉生成专属的数字人视频并发布于钉钉视频号。作为技术示例，由小冰框架生成的钉钉总裁叶军数字分身首次亮相，向大家展示了强大的多语言能力。未来，双方将持续探索在钉钉视频号、直播、视频会议、AI助理等领域的全面合作，推进数字人应用在钉钉全场景落地。小冰将充分发挥人工智能完备框架优势，助力钉钉进一步完善AI助理平台生态。此举旨在推动AI进入生产力

1/10/2024 2:19:00 PM

新闻助手

MoonValley！零基础也能快速学会的AI视频生成神器

本文为大家介绍一款视频生成 AI 工具 Moonvalley，只需简短的提示词，即可产生 16：9 的电影质感片段。接下来让我们来试一试吧。更多AI视频生成神器：一、使用体验目前，Moonvalley 处于 Beta 阶段，完全免费，需要在 Discord 中使用。 1. 加入频道在 Discord 中搜索 Moonvalley，点击顶部「join」会跳到 discord 的授权页面，按照流程往下走就行。

1/10/2024 5:52:02 AM

yaoyao

英伟达展示生成式AI驱动NPC，40SUPER系列显卡上线

引领 AI PC 的革新体验。

1/9/2024 10:33:00 PM

机器之心

大模型应用助力大学生备考提效夸克App上线“AI学习助手”

期末备考进行时，智能工具成为大学生提效的新“搭子”。日前，夸克App基于自研大模型的强大参数和数据精调能力，推出一款大模型全新应用“AI学习助手”，在部分搜索学习内容的结果页中，通过智能化的解题思路和讲解方式，进一步提升大学生在自学场景中的效率和质量。AI时代，学习不再是枯燥的刷题和找答案，尤其在大学阶段，通过互联网产品培养自主学习能力是提升自身竞争力的新方向。随着大模型应用逐渐落地以及用户需求不断变化，夸克App不仅能解决学习时面临的实际困难，还是每个人都能拥有的智能助手。夸克数据显示，过去一个月中，与大学学习相

1/9/2024 3:58:00 PM

新闻助手

对标GPTs但没有创建门槛，应用层的AI Agent玩家终于来了

从此在钉钉上，你只需要给出指令，其他事情交给「AI 助理」来办就可以了。2024 开年伊始，大厂便开始卷 AI Agent 了。过去一年，人工智能行业的风向标不断发生变化，最开始备受关注的是如雨后春笋般涌现的大语言模型及 AIGC 应用，接着又出现很多基于大语言模型打造的 AI 辅助应用（如微软 Copilot）。如今 AI Agent 成为激烈角逐点，是 AIGC 下一阶段的关键。去年 11 月， OpenAI 发布 AI Agent 初级形态产品 GPTs，让人看到智能体的应用前景。谷歌、亚马逊在该领域也有

1/9/2024 3:06:00 PM

机器之心

个人计算迎变革：联想集团10余款AI PC亮相CES 2024

1月9日，在2024年科技界的首场盛事国际消费电子展（CES）上，联想集团携40多款基于人工智能的全新设备与解决方案亮相，涵盖Yoga™、ThinkBook™、ThinkPad™、ThinkCentre™和Legion™等众多产品系列，为消费者和企业用户带来前所未有的个人计算体验。其中，10余款AI PC成为CES 2024的焦点，进一步推动联想集团“AI for All，让人工智能惠及每一个人”的愿景走向现实。AI PC爆发元年，产品规模化落地2023年以大模型为代表的生成式人工智能的爆发引起了全球关注，随着其进

1/9/2024 3:03:00 PM

新闻助手

OpenAI大呼冤枉，称《纽约时报》说法片面，吴恩达也为其发声

OpenAI：《纽约时报》的诉讼毫无根据。2023 年年底，《纽约时报》拿出了强有力的证据起诉微软与 OpenAI。根据多家科技公司的首席法律顾问 Cecilia Ziniti 的分析，《纽约时报》获胜的概率极大。机器学习领域著名学者吴恩达针对这件事连发两条推文说明了自己的观点。在他的第一条推文中，表达对 OpenAI 和微软的同情。他怀疑很多重复的文章实际是通过类似于 RAG（检索增强生成）的机制产生的，而非仅仅依赖模型训练的权重。来源：，吴恩达的推测被也遭到了反驳。纽约大学教授 Gary Marcus 表示在视

1/9/2024 2:56:00 PM

机器之心

奋战一年，LangChain首个稳定版本终于发布，LangGraph把智能体构建为图

著名的大模型智能体工具，现在有大版本更新了。不知不觉，LangChain 已经问世一年了。作为一个开源框架，LangChain 提供了构建基于大模型的 AI 应用所需的模块和工具，大大降低了 AI 应用开发的门槛，使得任何人都可以基于 GPT-4 等大模型构建自己的创意应用。在过去的一年中，LangChain 自身也一直在进化。刚刚，LangChain 官方宣布，他们的首个稳定版本 ——LangChain v0.1.0 问世了。新版本有以下几个重要特点：可观察性：构建复杂的 LLM 应用是困难的。为了更好地进

1/9/2024 2:53:00 PM

机器之心

百川智能发布角色大模型，零代码复刻角色轻松满足游戏领域定制需求

2024年1月9日，百川智能发布角色大模型Baichuan-NPC，深度优化了“角色知识”和“对话能力”，使模型能够更好的理解上下文对话语义，更加符合人物性格地进行对话和行动，让角色栩栩如生。此外，对于游戏领域AI角色开发成本高、周期长、自由度差、API不稳定等诸多不足，百川智能推出了“角色创建平台搜索增强知识库”的定制化解决方案。通过这一方案，游戏厂商无需编写任何代码，只需通过简单的文字描述，便可以快速构建出自己需要的角色，实现低成本、高效率的角色定制。今日起，用户登录，即可开启全新的角色创建之旅。中文领域最

1/9/2024 2:53:00 PM

新闻助手

资讯热榜

Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 MiniMax MCP Server正式上线，开启多模态AI新纪元 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 AI视频用哪个？6个知名的AI视频工具使用测评报告

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达人形机器人 Transformer 百度 AI视频苹果深度学习模态 xAI 字节跳动驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

应用

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

GauHuman开源：基于Gaussian Splatting，高质量3D人体快速重建和实时渲染框架

OPPO、锐思智芯、高通三方携手，共同推动智能手机影像AI Motion变革

视频一键转风格！详解AI视频神器 DomoAI 用法

AI做内核，荣耀「魔法OS」要做手机系统第三极

英伟达CES三款芯片连发，市值暴涨超6%，AI PC时代来临

翻车，才是斯坦福炒菜机器人学习人类的常态

Mixtral 8x7B论文终于来了：架构细节、参数量首次曝光

比A100性价比更高！FlightLLM让大模型推理不再为性能和成本同时发愁

钉钉×小冰：共同推出一键定制数字人，将在AI助理等领域全面合作

MoonValley！零基础也能快速学会的AI视频生成神器

英伟达展示生成式AI驱动NPC，40SUPER系列显卡上线

大模型应用助力大学生备考提效 夸克App上线“AI学习助手”

对标GPTs但没有创建门槛，应用层的AI Agent玩家终于来了

个人计算迎变革：联想集团10余款AI PC亮相CES 2024

OpenAI大呼冤枉，称《纽约时报》说法片面，吴恩达也为其发声

奋战一年，LangChain首个稳定版本终于发布，LangGraph把智能体构建为图

百川智能发布角色大模型 ，零代码复刻角色轻松满足游戏领域定制需求

大模型应用助力大学生备考提效夸克App上线“AI学习助手”

百川智能发布角色大模型，零代码复刻角色轻松满足游戏领域定制需求