大模型

从谷歌、微软、百度，到Perplexity、Kimi、秘塔，大模型真的“搭”上了搜索的快车吗？
编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）回到一年前， Perplexity 可能没想到自己押宝的这条赛道如今挤满了人。毕竟，直到今年 4 月，这家 AI 搜索的领头羊才刚刚迈入 10 亿美元俱乐部。然而就在上周，谷歌和 OpenAI 前后脚发布了新的 AI 搜索功能，大有打擂台的硝烟味。
理论
- 969
- 0
伊风11月5日
AI Agent应用出路到底在哪？
1 Agent/Function Call 的定义Overview of a LLM-powered autonomous agent system：图片Agent学会调用外部应用程序接口，以获取模型权重中缺失的额外信息（预训练后通常难以更改），包括当前信息、代码执行能力、专有信息源访问权限等。 2 从去年到现在有什么进展?Not a research seminar but good to kn…
理论
- 972
- 0
JavaEdge11月5日
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型
华为技术有限公司今日发文宣布，在昨日（11 月 2 日）的 2024 四川大学华西医院管理大会上，华西医院联合华为数据存储发布“华西黉医”医学大模型。据介绍，“华西黉医”医学大模型集成 10 余类通用模型和 50 余类垂域模型，融合 110 万条医患对话集、1600 余份共识指南、150 余部权威教材、100 余部医学政策法规、3.5PB 原始影像数据和 250 余万的病历数据，构建 720 亿…
应用
- 15
- 0
归泷（实习）11月3日
支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级
中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。时隔不到半年，TeleAI 星辰语音大模型的多方言能力再次升级，攻克了湛江话、宜宾话、洛阳话、烟台话等方言，将方言种类从 30 种提升至 40 种，并引入对英文的识别。与传统的有标注训练方法相比，TeleAI 通过预训练语音识别模型，利用海量无标注数据进…
应用
- 16
- 0
沛霖（实习）11月3日
豆包大模型团队开源RLHF框架，训练吞吐量最高提升20倍
强化学习（RL）对大模型复杂推理能力提升有关键作用，但其复杂的计算流程对训练和部署也带来了巨大挑战。近日，字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。这是一个灵活高效的 RL/RLHF 框架，可显著提升训练吞吐量，降低开发和维护复杂度。
应用
- 13
- 0
新闻助手11月1日
独家丨字节招兵买马，拟在欧洲设立AI研发中心
知情人士透露，字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛，积极招揽人才。而纵观欧洲各国的 AI 技术水平，瑞士、英国和法国相对靠前。其中，瑞士和英国都有不少知名院校。
应用
- 972
- 0
晓楠10月31日
95 后创业者 VAST 宋亚宸：要做3D「抖音」内容平台
2022 年 9 月接近尾声的一天，Google 发布了文生 3D 技术DreamFusion，利用预训练的 2D 文本到图像扩散模型，提出SDS（score distillation scapling）方法，首次完成开放域文本到 3D的合成。听到这个消息时，宋亚宸非常激动，他在商汤时就很关注 3D 生成技术。 DreamFusion的发布对于整个3D领域是一个大的转折点，意味着 3D内容制作的…
应用
- 970
- 0
张进10月31日
实时音视频领域拓荒者的十年
2015 年，声网将WebRTC大会引入中国，筹办了第一届面向国内开发者、业务人员和用户的RTC（实时视音频）大会。在大会开始的前夕，现任声网市场VP、RTC大会主策人彭小欢失眠了，她非常担心明天会不会有人来。一晃十年过去了，当年的RTC大会早已升级为RTE（实时互联网）大会， 10 月 25 日RTE 2024也如期而至，但早已不用担心是否有人光顾，现场可谓是座无虚席。
应用
- 972
- 0
张进10月31日
西湖大学发布 “AI 科学家” Nova，效果相比SOTA提升2.5倍
还记得今年夏天让众多科研工作者“瑟瑟发抖”的 AI scientist 吗？彼时的它，作为一个由谷歌Transformer 论文作者 Llion Jones 和前谷歌研究人员 David Ha 共同创立的全自动科学研究平台，从提出研究设想、检查创新程度，再到设计实验、编写程序、再GPU上执行实验并收集结果，到最后完成论文的撰写，一气呵成，让不少科研工作者早早就有了“事业危机感”。此外，该项目还…
应用
- 973
- 0
郑佳美10月23日
中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式
作者 | 中国科学院多学科交叉研究团队编辑 | ScienceAI近年来，大语言模型（LLMs）已在自然语言、计算机视觉等通用领域引发了新一轮技术革命，通过大规模语料和模型参数进行预训练，LLMs能够掌握语言的共性规律，能够对多种下游任务产生质的提升，已经形成了新的人工智能范式。在生命科学领域，单细胞组学技术的突破产生了大量不同物种细胞的基因表达谱数据，形成了海量的生命「语料」。如果把基因表达值看…
理论
- 5
- 0
ScienceAI10月8日
给机器人装上「虫脑」？非Transformer液态神经网络终于来了！MIT CSAIL负责人创业成果
在大模型时代，谷歌 2017 年开创性论文《Attention Is All You Need》中提出的 Transformer 已经成为主流架构。然而，刚刚一家由 MIT 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司 Liquid AI 却走出了不一样的路线。Liquid AI 表示他们的目标是「探索构建超越生成式预训练 Transformer (GPT) 基础模型的…
理论
- 25
- 0
机器之心10月1日
最受欢迎开源大模型，为什么是通义？
开源与闭源之争早已非新奇的话题，但毋庸置疑的是，开源极大地促进了大模型技术发展和生态繁荣。大模型被认为是最烧钱的技术，训练一个大模型往往需要大量的数据、计算资源，导致训练成本巨大，众所周知GPT-3的训练费用据说超过 4600万美元，在大模型开源之前，大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模…
应用
- 974
- 0
张进9月29日
上交大、复旦中山团队开发糖尿病专用大语言模型，助力个性化糖尿病管理
编辑 | ScienceAI随着全球糖尿病患病率的逐年攀升，糖尿病已成为全球范围内极具挑战的公共健康问题。据统计，全球约有 10% 的人口受到糖尿病的影响。到 2045 年，全球糖尿病患者人数预计将攀升至惊人的 7.83 亿。然而，由于糖尿病医生短缺、医疗资源分布不均以及患者自我管理能力的不足，糖尿病的管理和治疗仍面临重重困难。如何高效、智能化地管理糖尿病，已成为当前医学界和科技界共同关注的重要课…
理论
- 12
- 0
ScienceAI9月24日
23亿参数，Transformer架构，NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC
编辑 | KX9 月 23 日，IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC，该模型可以在台式计算机上运行，且开源。Prithvi WxC 具有 23 亿参数，使用 MERRA-2 数据集的 160 个变量开发而成。Prithvi WxC 采用创新的 Transformer 架构。研究人员在一系列具有挑战性的下游任务上测试了该模型，即：自回归滚动…
理论
- 8
- 0
ScienceAI9月24日
强化学习让大模型自动纠错，数学、编程性能暴涨，DeepMind新作
自我纠正（Self-correction）是大语言模型 (LLM) 非常重要的能力，但人们发现这种能力在现代 LLM 中基本上很少存在。现有的训练自我纠正的方法要么需要多个模型，要么依赖于更强大的模型或其他形式的监督。我们如何才能让 LLM 具备自我纠正能力？之前的研究要么依赖于提示工程，要么依赖于专门用于自我纠正的微调模型。但前者通常无法有效地进行有意义的内在自我纠正，而后者基于微调的方法需要在…
理论
- 4
- 0
机器之心9月21日
大语言模型如何助力药物开发? 哈佛团队最新综述
作者 | 莫纳什大学郑伊圳编辑 | ScienceAI大语言模型因其展现出类人般的推理、工具使用和问题解决能力而备受瞩目，此外，它在化学、生物学等专业领域也展现出深厚的理解能力，进一步提升了其应用价值。近日，哈佛大学、莫纳什大学和格里菲斯大学（Griffith University）组成的研究团队，发表最新综述《Large Language Models in Drug Discovery and…
理论
- 6
- 0
ScienceAI9月18日
GPT未竟的革命，由o1接棒：或是LLM研究最重要的发现
天下武功唯快不破，但 OpenAI 不走寻常路，新出的 o1 系列宣告天下：我们更慢，但更强了。 o1 要花更多的时间思考问题，再做出反应，但在复杂推理层面直接窜了几个档位。在国际数学奥林匹克 (IMO) 资格考试中，GPT-4o 仅正确解决了 13% 的问题，而 o1 得分为 83%。
应用
- 972
- 0
刘洁9月13日
元象发布中国最大MoE开源大模型落地应用登顶港台榜
元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，加速AI应用低成本部署，将国产开源提升至国际领先水平。该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升，同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。元象「高性能全家桶」系列全部开源，无条件免费商用，让海量中小企业、研究者和开发者能按需选择。
应用
- 973
- 0
朱可轩9月13日
端侧ChatGPT时刻！这家清华系大模型公司赶在OpenAI、苹果之前
下周苹果即将召开发布会了！但最令笔者期待的不是 iphone16，而是苹果今年提出的 Apple Intelligence 的进展，这是苹果今年进军端侧 AI 的一大杀手锏。其实早在今年年初，国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号，当时还没有太多玩家意识到端侧AI的重要性。
应用
- 972
- 0
我在思考中9月9日
阶跃星辰开放平台迎来多项更新，上线 Step-1X 图像生成大模型
近日，大模型创业公司阶跃星辰在其开放平台体验中心，正式上线了图像生成大模型 Step-1X，注册即可体验。（指路链接：）事实上，这款大模型之前已经备受期待。在 7 月份举行的 2024 世界人工智能大会上，阶跃星辰一口气发布了万亿参数语言大模型 Step-2、多模态大模型 Step-1.5V 和图像生成大模型 Step-1X 三款大模型，并且跟上海电影梦幻联动，基于经典 IP《大闹天宫》开发了…
应用
- 971
- 0
我在思考中9月3日
分子大模型升级，Uni-Mol+加速量子化学属性预测，深势科技、北大研究登Nature子刊
编辑 | KXUni-Mol 是深势科技于 2022 年发布的一款基于分子三维结构的通用大模型，其性能优越、模型泛化能力强，在小分子性质预测、蛋白靶点预测、量子化学性质预测、MOF 材料吸附性能预测等任务上都超越了现有的解决方案。今年 3 月，深势科技与清华大学等合作，提出基于 Uni-Mol 的领域专属模型 Uni-MOF，用于预测各类工况下纳米多孔材料对各类气体的吸附性能，预测精度高达 0.9…
应用
- 58
- 0
ScienceAI8月27日
讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live
站在科技创新的浪潮之巅，我们见证了人工智能领域的巨大飞跃，尤其是大模型技术与强化学习中的结合和突破性应用，正在引领我们进入一个全新的智能时代。在过去几年中，强化学习作为人工智能的一个重要分支，已经从理论研究的深奥殿堂走向了实践应用的广阔天地，从实验室的封闭空间走向了我们日常生活的各个角落。在自动驾驶、游戏AI、机器人控制等领域，强化学习的身影无处不在，它们正逐步成为我们生活中不可分割的一部分。
应用
- 972
- 0
岑大师8月23日
发布三个月，豆包大模型综合能力提升20.3%，应用落地再提速
8月21日，火山引擎AI创新巡展在来到上海。此次巡展会，火山引擎发布了豆包大模型的一系列产品升级，并携手多点 DMALL 成立零售大模型生态联盟。火山引擎总裁谭待表示，较3个月前，最新版豆包大语言模型的综合能力提升了20.3%，在智源、上海AI Lab等权威机构的多项评测中位列榜首。
应用
- 969
- 0
代聪飞8月21日
AI在用 | AI卷起「穷鬼健身」，15天涨粉上万
机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱：[email protected]日本国民女神天海佑希有句名言：男人会背叛你，但肌肉不会。网友纷…
应用
- 13
- 0
机器之能8月19日