资讯列表

腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型

腾讯今日宣布推出 Hunyuan-Large 大模型,官方表示这是目前业界已经开源的基于 Transformer 的最大 MoE 模型,拥有 3890 亿总参数(389B)和 520 亿激活参数(52B)。 腾讯今日在 Hugging Face 开源了 Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和 Hunyuan-A52B-Instruct-FP8。 并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。

视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

视觉定位(Visual Grounding)旨在基于自由形式的自然语言文本表达定位图像中的目标物体。 随着多模态推理系统的普及,如视觉问答和图像描述,视觉定位的重要性愈加凸显。 已有的研究大致可以分为三类:两阶段方法、单阶段方法和基于Transformer的方法。

AI技术:制造业的未来还是泡沫幻影?

在探讨制造业的未来时,一个不可忽视的趋势是高科技制造业对人工的依赖正在逐渐减少。 传统观念中,人工操作往往被视为生产过程中的污染源,如呼吸、皮肤屑、头发等都会对精密制造构成威胁,同时人工操作也伴随着各种错误和失误的风险。 因此,全自动化的生产车间,依托人工智能技术的强大支撑,正逐步崛起为制造业发展的新航标。

手机秒拍动画大片,高级运镜效果惊人!Runway两弹更新,火得一塌糊涂

前几天,Runway宣布更加灵活逼真的AI摄像头控件上线,开始实现3D化! 该功能Gen-3 Alpha Turbo视频生成模型可用。 而就在一个多星期前,10月23日,Runway还宣布了Gen-3 Alpha的新功能Act-One。

重大突破!AI首次发现内存安全漏洞

近日,谷歌宣布其大语言模型(LLM)项目“Big Sleep”成功发现了一个SQLite数据库引擎中的内存安全漏洞,这是人工智能首次在真实软件中发现可利用的内存安全漏洞(且该漏洞无法通过传统的模糊测试检测到)。 AI首次发现内存安全漏洞谷歌的“Project Naptime”项目旨在评估LLM在进攻性安全研究方面的能力,后来该项目演变为“Big Sleep”,由谷歌Project Zero和DeepMind团队共同参与。 Big Sleep项目致力于探索AI在发现软件漏洞中的潜力,特别关注高危漏洞的检测与利用。

要创造商业价值,利用AI来利用公司的数据

用专有数据训练大型语言模型能为你带来竞争优势吗?尽管我们生活在一个日益数据驱动的世界中,但大多数公司并未采用数据驱动的商业模式。 像Alphabet、Meta和亚马逊这样的企业凭借网络效应形成的良性循环而取得成功,但这种模式对于销售传统产品和服务的组织来说却难以实现,然而,如今已能广泛获取各种工具来充分利用日常业务流程中生成的专有数据,这些工具可能帮助你的公司形成竞争优势。 随着市场竞争的加剧,利用数据构建防御性护城河至关重要。

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

北大校友打造的1000个智能体「我的世界」,背后原理揭晓了! 团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……其中最精彩的,当数团队整活儿:让牧师NPC引入虚拟宗教,最后发现该宗教在500个智能体(横跨6大城乡)中进行了广泛传播。 据介绍,项目整体由一个名为PIANO的架构提供支持,它核心解决多智能体交互问题,用于确保多个输出流的一致性。

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型(如 GPT-4o、DALL-E 3)通常拥有数十亿参数,且模型权重不公开,使得传统的白盒优化方法(如反向传播)难以实施。 那么,有没有更轻松的优化方法呢? 就在最近,卡内基梅隆大学(CMU)的研究团队对于这个问题提出了一种创新的“黑盒优化”策略——通过大语言模型自动调整自然语言提示词,使视觉语言模型在文生图、视觉识别等多个下游任务中获得更好的表现。

Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式

复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。 简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略 价值评估)。 在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学能力,积累了一些关注。

AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨

就在刚刚,Anthropic宣布,Claude 3.5 Haiku已经可以通过API访问。 图片与此同时,就在今天,Grok API也官宣正式开启公测。 图片Claude 3.5 Haiku正式开放APIClaude 3.5 Haiku现已在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供。

GPT-4o mini 的 6.7/8.3 倍,Claude 3.5 Haiku AI 模型每百万 tokens 输入 1 美元 / 输出 5 美元

Anthropic 昨日(11 月 4 日)发布博文,宣布开发者可以通过第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI,调用 Claude 3.5 Haiku 模型。 Claude 3.5 Haiku 对标的是 OpenAI 的 GPT-4o Mini 和谷歌的 Gemini 1.5 Flash,在多项 AI 基准测试中超越了 Anthropic 上一代中最大的模型 Claude 3 Opus。 Anthropic 表示目前 Claude 3.5 Haiku 模型仅上线文本模态,未来将支持图像输入。

ChatGPT已经慢了,这是国内AI搜索新高度,免费可用

最近几天,谷歌、微软等老牌搜索巨头们的压力陡增! 原来,向他们发起挑战的 AI 搜索领域「战火重燃」。 先是 Meta 被曝出正在开发 AI 搜索引擎,以减少在 AI 实时摘要生成中对谷歌和微软的依赖;紧接着 ChatGPT 正式完成向 AI 搜索的升级,让用户通过网络资源链接快速获取实时搜索结果。

重庆市:目标到 2027 年将机器人广泛应用于经济社会各领域

11 月 5 日消息,为推动机器人产业高质量发展,推进机器人典型应用开发,推广“机器人 ”应用创新实践,重庆市经济信息委、市教委等八单位 10 月 28 日联合印发《重庆市“机器人 ”应用行动计划(2024—2027 年)》(下称《行动计划》)。 《行动计划》提出到 2027 年,机器人广泛应用于重庆市经济社会各领域,机器人典型示范应用成效显著。 聚焦机器人应用重点领域,突破一批机器人关键技术,开发一批机器人中高端产品,引育一批“机器人”应用标杆企业,提供一批机器人创新应用解决方案,推广一批具有较高水平、创新应用模式和显著应用成效的机器人典型应用场景,打造一批应用体验中心和试验验证中心,推广一批“机器人”试点区县。

OpenAI也要做消费类硬件了?Meta前AR眼镜负责人加盟

OpenAI 不仅专注于软件,还要深入硬件研究。 Meta 增强现实眼镜项目前负责人 Caitlin Kalinowski 宣布,她将加入 OpenAI,领导机器人和消费类硬件业务。 刚刚,Kalinowski 在领英上写道:「非常高兴地告诉大家我将加入 OpenAI,领导机器人和消费类硬件业务!

LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题

让 LLM 在自我进化时也能保持对齐。 我们这个世界是不断变化的开放世界。 人工智能要在这个世界长久立足,就需要突破许多限制,包括可用数据和规模和质量以及有用新信息的增长率。

人工智能时代下机遇与挑战并存的选择:医学专业

人工智能(AI)已经无处不在,并且在医学领域的应用也越来越广泛。 在某些情况下,AI可以增强甚至取代医生的一部分工作。 医学生在选择专业时,应当考虑到AI将如何改变医生的岗位形态(以及获得的薪酬待遇)。

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。