百川智能
消息称 AI 独角兽百川智能放弃金融领域,转而聚焦医疗
在 2025 年 1 月的访谈上,王小川就对《晚点》提及了医疗的落地计划:AI 儿科医生在北京儿童医院上岗;第一季度,百川的“AI 医生助理”要落地海淀区。
百川智能联合北京儿童医院推出“AI儿科医生”,正式投入临床应用
百川智能今日宣布,其与北京儿童医院及小儿方健康科技(北京)有限公司联合研发的“AI儿科医生”在经过近一个月的内测并得到专家认可后,正式投入临床应用。 这一里程碑式的进展标志着AI技术在医疗领域的深度应用迈出了重要一步。 图源备注:图片由AI生成,图片授权服务商Midjourney在昨日由国家儿童医学中心首都医科大学附属北京儿童医院首次开展的“AI儿科医生 多学科专家”双医并行多学科会诊活动中,基于Baichuan M1大模型打造的“AI儿科医生”与13位来自耳鼻咽喉头颈外科、肿瘤外科、肿瘤内科等领域的知名专家共同参与会诊,其诊断建议与专家组的结论高度吻合,展现了强大的诊疗能力。
百川智能上线开源全模态模型 Omni-1.5,号称多项能力超越 GPT-4o mini
官方宣称,其在视觉、语音及多模态流式处理等方面,Baichuan-Omni-1.5 的表现均优于 GPT-4omini;在多模态医疗应用领域,其具备更突出的领先优势。
最懂医疗的国产推理大模型,果然来自百川智能
年关将近,全球 AI 大模型却突然卷了起来。 就在本周,Kimi 的新模型打开了强化学习 Scaling 新范式,DeepSeek R1 用开源的方式「接班了 OpenAI」,谷歌则把 Gemini 2.0 Flash Thinking 的上下文长度延伸到了 1M。 种种迹象表明,进入推理增强赛道的各位玩家正试图在最近一两个月卷出个高下。
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩领先 GPT-4o
百川智能今日发布全链路领域增强金融大模型 Baichuan4-Finance,融合 100B + 中英文金融知识,采用多层次质量评估体系进行筛选,由人民大学财政金融学院金融专家团队全程参与定义和评估。
百川行业首创领域自约束训练方案,Baichuan4-Finance金融场景能力领先GPT-4o近20%
12 月 23 日,百川智能发布全链路领域增强大模型 Baichuan4-Finance。 在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,Baichuan4-Finance 实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。 其金融专业能力和场景应用能力大幅领先 GPT-4o,在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内主流开源金融评测基准 FinancelQ 上均登上榜首。
百川智能联合创始人洪涛离职,曾任搜狗公司首席营销官
百川智能方面回复称:“洪涛因个人原因已从公司离职。在公司创立初期,他快速搭建了商业化团队,为公司发展奠定了基础。我们非常感谢他的付出和贡献。”
亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局
今日融资快报AMD以49亿美元收购服务器制造商ZT Systems据报道,AMD已同意以49亿美元现金和股票交易收购人工智能基础设施集团ZT Systems,此举延续了该芯片公司在人工智能领域的投资势头,旨在挑战市场领导者 Nvidia。 这家总部位于加州的集团表示,此次收购将有助于加速其 Instinct 系列 AI 数据中心芯片的采用,该系列芯片将与Nvidia流行的图形处理单元进行竞争。 亚马逊斥资8000万美元收购Xperi子公司Perceive AIPerceive是一家芯片制造商和AI模型压缩服务商,专注于为边缘设备提供大型人工智能模型的边缘推理解决方案,这些设备通常位于网络边缘,拥有有限的功率、处理能力、连接性和存储空间。
时隔一天,百川大模型拿下国产第一,AI助手「百小应」上线
目标大模型「超级应用」。最近几天,国内 AI 创业公司正在连续刷新大模型的能力上限。5 月 22 日,百川智能发布最新一代基座大模型 Baichuan 4,同时推出了首款 AI 助手「百小应」。相较 1 月份发布的 Baichuan 3,新一代模型在各项能力上均有大幅提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14% 和 9%,在国内权威大模型评测机构 SuperCLUE 的评测中,Baichuan-4 大模型能力排名国内第一,超越了 SenseChat V5。「在通往 AGI 的路上,我们需要超级
百川智能发布超千亿大模型Baichuan 3,中文评测水平超GPT-4
1 月 29 日,百川智能正式发布千亿参数的大语言模型 Baichuan 3。在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展现了出色的能力,尤其在中文任务上更是超越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色,证明了 Baichuan 3 在自然语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的 MCMLE、MedExam、CMExam 等权威医疗评测上的中文效果同样超过了
大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」
用好企业知识库是大模型应用破局的关键。从 ChatGPT 最初发布算起,虽然大模型的热潮已经持续了一年多,但大部分时间依然停留在学术前沿和技术创新层面,深入具体场景实现产业价值的案例并不多见。实际落地的种种挑战最终指向一个方向:行业知识。面对各行各业的垂直场景,依靠网络公开信息和知识预训练的通用模型很难搞定准确性、稳定性、性价比等问题。如果在外部实时信息搜索之余辅以强大的专门的企业知识库,让模型对行业知识的理解大大增强,效果自然更好。这就好比我们熟悉的「开卷考试」模式,人类大脑的「内存容量」越强越好,但终归有上限,
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
大模型看书,从来没有这么快过。国内大模型创业公司,正在技术前沿创造新的记录。10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字,长度达到了 GPT-4(32K token,约 2.5 万字)的 14 倍,Claude 2.0(100K token,约 8 万字) 的 4.4 倍。换句话说,Baichuan2-192K 可以一次性读完一本《三体 2》,是全球处理上下文窗口
- 1