大模型

一日一技：超简单方法显著提高大模型答案质量

很多人都知道Prompt大神李继刚，他使用Lisp语法来写Prompt，把大模型指挥得服服帖帖。但我们很多时候没有办法把自己业务场景的Prompt改造成伪代码的形式。相信不少人跟我一样，会使用Markdown格式来写Prompt，大部分时候没什么问题，但偶尔总会发现大模型返回的结果跟我们想要的不一样。

12/27/2024 12:44:44 AM

kingname

劲爆！理想汽车转做大模型，主持人质疑李想是否跟风：你有理想吗？李想自曝三次创业心得：终极是硅基家人，要做中国第一！

编辑 | 言征厂长李想回来了！不过出人意料的是，李想一公开露面，就曝出一个大料：李想要把理想汽车这家车企改造成一家AI企业？昨晚，理想汽车官宣的三天直播上来就抛出了一个让人脑洞大开、议论纷纷的话题。

12/26/2024 4:46:49 PM

言征

英伟达年终核弹！全新B300为o1推理大模型打造，RTX5090也曝光了

英伟达老黄，成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光：GPU新核弹B300，以及附带CPU的超级芯片GB300。高算力，在产品层面上相比B200在FLOPS上提高50%大显存，从192GB提升到288GB，也是提高了50%。

12/26/2024 11:45:48 AM

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现——o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC题目进行了细致观察。

12/26/2024 11:42:56 AM

网页多模态建模思考

1.综述网页本质上是一种超文本，一般由超文本标记语言来定义（例如HTML）。 HTML是一种基础技术，常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面。网页浏览器内核通过解释HTML文件，通过视觉引擎将其渲染成可视化网页。

12/26/2024 1:20:53 AM

百度Geek说

大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造

大模型版生命游戏来了。 ALife，即人工生命，旨在通过人工手段研究生命和类生命过程。程序员们深深着迷的康威生命游戏，就属于这一研究领域。

12/25/2024 3:36:44 PM

国产AI之光！TeleAI星辰大模型入选央企十大国之重器评选

近日，国务院国资委新闻中心发起“十大国之重器”年度盘点，从2024年中央企业建设的众多重点项目中精心选出20项既有影响力又有创新力的大国重器，诚邀广大网友评选“年度十大国之重器”。由中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）打造的“全国产化万亿参数星辰大模型发布”光荣入选，成为国产AI的佼佼者，展现了中国电信在人工智能领域的领先地位。星辰大模型，开启国产AI新时代星辰大模型，是由中国电信自主研发打造的全国产化万亿参数大模型，是国内AI技术的重大突破。

12/25/2024 2:50:00 PM

新闻助手

基座大模型「六进二」：南阶跃，北智谱

作者丨陈彩娴今天消息，阶跃星辰完成了 B 轮融资，总融资金额达数亿美元。 AI 科技评论获悉，此次融资有国资、战略和财务投资人等多家参与，核心投资方包括上海国有资本投资有限公司及其旗下基金，战略和财务投资人包括腾讯投资、五源资本、启明创投等。据了解，这笔融资将用于继续投入基础模型研发，强化多模态和复杂推理能力，并通过产品和生态加大覆盖 C 端应用场景，提供丰富的用户体验。

12/25/2024 2:38:00 PM

陈彩娴

OpenAI被曝自研人形机器人，四年前因缺数据解散团队，如今要用机器人数据反哺大模型了

o3之后，OpenAI下一个项目曝光了：人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司，也不只是算法团队搞机器人强化学习。而是自己涉足硬件，研发有双臂、双腿的实体人形机器人。 Information的消息称，两位直接了解这个项目的人透露了这个消息。

12/25/2024 10:58:29 AM

近1.4万星，腾讯混元大模型开源成绩单公布，多次登顶开源趋势热榜

记者获悉，腾讯云副总裁，腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示，腾讯将开源协同作为公司的核心技术战略，积极推动内外部技术开源共享。腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源，未来大模型各版本也将进一步开源，与社区开发者一起共同推动技术生态繁荣发展。（腾讯云副总裁，腾讯混元大模型负责人刘煜宏）腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态，是开源系列模型中较全的，其模型性能也得到了开源社区的高度认可，总GitHub Star（星星）数量近1.4万颗，并且多次登顶趋势榜。

12/24/2024 11:17:00 AM

新闻助手

市场份额稳居前三！商汤智算服务持续领跑

国际权威咨询机构IDC近日发布《中国智算服务市场（2024上半年）跟踪》报告。报告显示，2024年上半年，商汤科技作为国内领先的智算服务商，以13.3%的市场份额稳居GenAI IaaS市场Top3，位列GenAI IaaS领域第一梯队。 Gen AI驱动，商汤站稳智算市场头部阵营2024上半年中国智算服务整体市场同比增长79.6%，市场规模达到146.1亿元人民币。

12/23/2024 5:22:00 PM

新闻助手

ABCoder 在大模型编程领域的探索

前言大语言模型（以下简称大模型或 LLM）真正意义上火出圈，应该算是 OpenAI 发布 ChatGPT 后（22 年底）。从这个时间开始，到现在为止，已经过了很长一段时间了，市面上也出现了一些编程工具，比如 MarsCode、Copilot 或者 Cursor 等比较火的结合 IDE 的插件和工具。而实际上：经过了这么长时间的 LLM 产品发展，大家的编程方式真的被改变了吗？

12/23/2024 4:02:39 PM

高文举

李飞飞谢赛宁新作「空间推理」：多模态大模型性能突破关键所在

李飞飞谢赛宁再发新成果：直接把o1式思考拉至下一个level——多模态大语言模型的空间思维！这项研究系统评估了多模态大模型的视觉空间智能，结果发现：当前，即使是最先进的多模态大模型，在空间认知方面与人类相比仍有显著差距，测试中约71%的错误都源于空间推理方面的缺陷，即空间推理能力是当前主要瓶颈。图片更为有趣的是，在这种情况下，思维链、思维树等常用的语言提示技术直接失灵了——不仅没有提升模型在空间任务上的表现，反而会使性能下降。

12/23/2024 12:37:34 PM

大模型检索增强生成之向量数据库的问题

作为技术人员我想大家或多或少应该都接触过数据库技术，数据库技术的历史可以说是由来已久了；但数据库的发展也是一路曲折，特别是随着互联网体量的快速增加，对数据库的要求也变得越来越多。而且为了适应各种不同的业务场景，数据库系统也是紧跟潮流发展出多种类型的数据库；比如说传统的关系型数据库，缓存数据库，以及大数据处理的数据库；直到今天的向量数据库。关系型和缓存数据库就不用说了，今天我们就来聊聊向量数据库系统。

12/23/2024 11:31:05 AM

DFires

百川行业首创领域自约束训练方案，Baichuan4-Finance金融场景能力领先GPT-4o近20%

12 月 23 日，百川智能发布全链路领域增强大模型 Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创的领域自约束训练方案，Baichuan4-Finance 实现了金融能力和通用能力同步提升的效果，极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力大幅领先 GPT-4o，在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内主流开源金融评测基准 FinancelQ 上均登上榜首。

12/23/2024 10:34:00 AM

新闻助手

消息称雷军重金招募大模型领军人才，DeepSeek 罗福莉将加入小米

知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。（第一财经新皮层）

12/20/2024 10:48:21 PM

沛霖（实习）

释放数字金融向新力，奇富科技金融AI大模型成果落地上海金融科技国际论坛特展周活动

12 月 19 日，在第六届上海金融科技国际论坛之“2024年度人工智能大模型金融领域示范场景及创新应用案例成果特展”活动周上，由上海金融科技产业联盟创新监管联合实验室指导，奇富科技主办的“攻坚金融科技创新与大模型应用、释放数字金融向新力” 主题成果展在沪举办，全面展示了奇富科技在金融科技领域的创新实践。同时，上海金融科技产业联盟创新监管实验室与奇富科技现场达成创新伙伴合作，双方将共同探索金融科技创新的路径，推动新技术在金融领域高效、安全的应用，助力上海全球金融科技中心建设。奇富科技CEO吴海生在特展现场强调，科技是驱动金融创新的关键，能打破传统边界，以智能化、个性化方案满足多元化金融需求。

12/20/2024 11:49:00 AM

新闻助手

腾讯版Sora开源后，被提速八倍！官方点赞并预告：下月上新图生视频

提速8倍！速度更快、效果更好的混元视频模型——FastHunyuan来了！新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。

12/20/2024 7:00:00 AM

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练