北大

北大清华等联合发布 LLaVA-o1：首个自发性视觉 AI 模型，推理计算 Scaling 新思路

由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学（Lehigh University）组成的研究团队，最新推出了 LLaVA-o1，这是首个具备自发性、类似于 GPT-o1 的系统性推理视觉语言模型。

11/19/2024 11:38:30 AM

故渊

加速量子化学计算，字节&北大团队量子蒙特卡罗研究新进展登Nature子刊

编辑 | 萝卜皮基于神经网络的变分蒙特卡罗（NN-VMC）已成为一种有前途、有潜力的从头计算量子化学的尖端技术。然而，现有方法的高计算成本，阻碍了它们在现实化学问题中的应用。字节跳动与北京大学团队介绍了 NN-VMC 的最新研究进展，它实现了显著的加速率，从而极大地将 NN-VMC 的适用性扩展到更大的系统。该团队的关键设计是一个名为 Forward Laplacian 的计算框架，它通过有效的前向传播（forward）过程来计算与神经网络相关的 Laplacian（这是 NN-VMC 的瓶颈）。然后，研究人员证明

2/27/2024 3:55:00 PM

ScienceAI

BAAI、北大&港中文团队提出 SegVol：通用且可交互的医学体素分割模型

编辑 | ScienceAI上周，北京智源人工智能研究院（BAAI）、北京大学和香港中文大学的研究团队开源了 SegVol 医学通用分割模型。与过去一些很棒的 Medical SAM 工作不同，SegVol 是第一个能够同时支持 box，point 和 text prompt 进行任意尺寸原分辨率的 3D 体素分割模型。作为一个便捷的通用分割工具，研究人员将 SegVol 代码和模型开源到 GitHub:BAAI-DCAI/SegVol，欢迎大家使用。目前开源的模型权重文件包括（1）使用 96k CTs 预训练 2

11/28/2023 2:20:00 PM

ScienceAI

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型