资讯列表

密苏里大学许东:大模型时代,Prompt 为生物信息学研究带来新动力丨IJAIRR

自ChatGPT在2022年横空出世,人工智能领域便迎来了一场新的革命。 大语言模型(LLMs)以其卓越的文本处理能力,迅速成为研究者和开发者的新宠。 随着这些模型的崛起,如何与它们有效交互的问题也日益凸显,提示词(Prompt)的概念逐渐成为研究的热点。

为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗?不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人们的无情嘲笑。嘲笑之后,大家也冷静了下来,开始思考:低级错误背后的本质是什么?大家普遍认为,是 Token 化(Tokenization)的锅。在国内,Tokenization 经常被翻译成「分词」。这个翻译有一定的误导性,因为 Tokenization 里的 token 指的未必是词,也可以

反转了?在一场新较量中,号称替代MLP的KAN只赢一局

KAN 在符号表示中领先,但 MLP 仍是多面手。多层感知器 (Multi-Layer Perceptrons,MLP) ,也被称为全连接前馈神经网络,是当今深度学习模型的基本组成部分。MLP 的重要性无论怎样强调都不为过,因为它是机器学习中用于逼近非线性函数的默认方法。然而,MLP 也存在某些局限性,例如难以解释学习到的表示,以及难以灵活地扩展网络规模。KAN(Kolmogorov–Arnold Networks)的出现,为传统 MLP 提供了一种创新的替代方案。该方法在准确性和可解释性方面优于 MLP,而且,它

贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

用来运行 Llama 3 405B 优势明显。最近,Meta 开源了最新的 405B 模型(Llama 3.1 405B),把开源模型的性能拉到了新高度。由于模型参数量很大,很多开发者都关心一个问题:怎么提高模型的推理速度?时隔才两天,LMSYS Org 团队就出手了,推出了全新的 SGLang Runtime v0.2。这是一个用于 LLM 和 VLM 的通用服务引擎。在运行 Llama 3.1 405B 时,它的吞吐量和延迟表现都优于 vLLM 和 TensorRT-LLM。在某些情况下(运行 Llama 系列

万亿token!史上最大多模态数据集诞生

开源多模态大模型或将开始腾飞。值此 Llama 3.1 占领各大头条之际,又突然冒出了另一个也非常重要的发布 —— 一个规模空前的开源多模态数据集。对大模型来说,数据集的重要性无需多言,甚至可以说没有大型数据集就不可能有大模型。现在正是多模态大模型(LMM)发展正盛的时候,规模足够大的优质且开源的多模态数据集已经成为该领域的一大「刚需」。不过,相比于开源的文本数据集,现有的开源多模态数据集都比较小、多样性也不足,并且来源基本都是 HTML 文档 —— 这就限制了数据的广度和多样性。这无疑限制了开源 LMM 的发展,

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文第一作者皮仁杰是香港科技大学三年级博士生,师从张潼教授和周晓方教授。此前获得香港大学计算机工程学士学位。研究兴趣为多模态大语言模型,以数据为中心的人工智能,以及自动化机器学习。随着大型

无视网站反 AI 抓取政策,Anthropic 爬虫机器人惹多个网站所有者不满

据 The Verge 当地时间 26 日报道,Anthropic 公司使用的 ClaudeBot 在短短 24 小时之内,就访问了 iFixit 网站近百万次,此举违反了该网站的使用条款。这一显得有些疯狂的举动,引起 iFixit 的 CEO Kyle Wiens 直接在 X(推特)上开怼,AI在线附大意如下:“如果这些请求(指访问)中的任何一个访问了我们的使用条款,那么它会告诉你我们的内容被明确禁止使用。别问我,去问 Claude!”“我知道你渴望获得数据,Claude 也真的很聪明!但是,你真的有必要在 24

蔚来发布“中国首个”智能驾驶世界模型 NWM:0.1 秒内推演出 216 种可能发生的场景

在今日下午的 NIO IN 2024 蔚来创新科技日活动中,蔚来发布智能驾驶世界模型 NWM(NIO World Model),号称是“中国首个”。据介绍,它是一个多元自回归生成式的具身驾驶模型,可全量理解数据、具有长时序推演和决策能力,能在 100 毫秒内推演出 216 种可能发生的场景,在「万千平行世界」中寻找最优路径。作为生成式模型,NWM 还能基于 3 秒的驾驶视频,生成 120 秒的想象视频。NWM 具备与生俱来的闭环仿真测试能力,已在复杂交互场景中全面测试并验证性能。AI在线从发布会获悉,蔚来还发布了智

70 年前的阿兰・图灵情书!计算机之父和一段「有罪」的罗曼史

1953 年,计算机之父 Alan Turing 和 Christopher Strachey 创作出情书生成器,科技与情感早在 70 年前以情书为载而交汇。在 20 世纪 50 年代初,曼彻斯特大学计算实验室的墙上贴满了小而奇特的情书。情书很寻常,不寻常的是,这些抒发炽热情感的情书是由冰冷算法写成的,远远早于 ChatGPT 出现 70 年。而情书背后的历史更加离奇,1952 年,早在阿尔特曼和 OpenAI 还不知道在哪儿的时候,曼彻斯特大学的两位学生,Alan Turing 和 Christopher Str

大厂实战案例!如何用AIGC快速完成IP设计?

在公司接到一个 IP 形象的设计需求?作为乙方接到了甲方的 IP 设计?想要给自己设计一个 IP 形象?我知道你很急,但是请先别急,AIGC 也能做 IP! 本文邀请大家围观设计师是如何借助 AI 快速生产出 “图图”IP 的~一、图图是谁?为什么要做? “图图“是 58 最新开发的图库平台-图狗 TUGO 的 IP 形象,本文将为大家带来 AIGC 是如何帮助设计师更高效地进行 IP 形象设计,为 IP 设计提供全新的创作方式和灵感。 IP 形象设计作为品牌设计延伸的一种,承载着品牌的独特性与想象空间。在品牌宣传

“AI 分析师”登陆华尔街,摩根大通开始内部推广聊天机器人

据《金融时报》今日报道,摩根大通开始在公司内部推出一款生成式 AI 产品,并告诉员工这款“自有版本的 ChatGPT”可以完成研究分析师的工作。▲ 图源摩根大通报道援引摩根大通内部备忘录称,该公司已经向其资产和财富管理部门的员工提供了一个名为 LLM Suite 的大型语言模型平台。高管们告诉员工,LLM Suite 可以通过访问第三方模型帮助他们撰写、生成创意和总结文件。LLM Suite 被描述为一个“类似 ChatGPT 的产品”,用于“通用生产力”领域。知情人士表示,摩根大通今年早些时候开始向部分银行员工推

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新 ——即日起,Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。此外新版聊天机器人还增加了“事实核查”功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。有网

智谱 AI CEO 张鹏谈文生视频:当前可用来做影视辅助工作,若要改变电影制作仍需距离

据新浪科技报道,智谱 CEO 张鹏今日接受采访,谈到了基于生成式 AI 的文生视频技术对影视行业的冲击等话题。他表示,从 OpenAI 的 Sora 出现之后,有关话题就一直在讨论。在国外,这件事已经引起很大影响,包括好莱坞罢工等。张鹏透露,自己有一次在北京电影学院与教师一同讨论此事,众人得出了一致的看法:从技术发展角度来看,大家都认为 AI 的发展“是很好的事情”,也是“很重要的方向”,对影视行业的变化有积极意义。张鹏表示,从目前来看,“至少也觉得如果把这项技术用在直接面向最终观众的生产过程当中,可能还是不太够。

国际奥委会:最大限度发挥 AI 工具影响力,体育人才选拔方式有望得到革新

据新华社报道,在 24 日召开的发布会上,国际奥委会首席信息科技官伊拉里奥・科尔纳表示,已经确定了超过 180 个潜在的 AI 应用场景,要最大限度发挥它们的影响力。据介绍,AI 工具可以在辨别体育人才方面展现价值 —— 通过相应技术,仅凭手机软件就能在世界任何地方“发现”新的体育人才。目前,国际奥委会与英特尔正共同开发相关定制化技术,旨在帮助各国和地区奥委会创新体育人才识别和投资培养方式,相关技术已在塞内加尔完成相应测试。图源 Pexels2026 年,塞内加尔即将迎来非洲地区首个奥林匹克赛事 —— 达喀尔青奥会

推动端侧生成式AI,英特尔已经有了全方位布局

每一个垂直行业,都需要边缘AI。

字节豆包上线吴敏霞、林丹等专属智能体 奥运冠军AI分身实时陪看

2024年东京奥运会即将开幕。7月26日,智能AI助手豆包宣布携手跳水奥运冠军吴敏霞、羽毛球奥运冠军林丹、体育解说员黄健翔及体育解说员刘语熙共同打造专属奥运智能体,用户可以在豆包App中和他们畅聊奥运话题。同时,豆包网页版也将上线“AI带你解读奥运”专区,为用户提供奥运新闻早晚报、赛事回放、AI解说等内容。据介绍,上述明星智能体不仅在对话语气上模拟了几人的性格特征,同时也获得了声音授权,用户可以随时在豆包中体验与这些专业人士交流奥运赛事的乐趣。比如和激情四溢的黄健翔共同探讨足球比赛的战术布局和精彩进球;听林丹讲述羽

微软现支持开发者微调 Phi-3-mini 和 Phi-3-medium AI 模型

微软公司昨日(7 月 25 日)发布博文,宣布在 Azure 上支持开发者微调(fine-tune) Phi-3-mini 和 Phi-3-medium AI 模型,针对不同用例提高模型的性能。例如,开发者可以微调 Phi-3-medium 模型,用于辅导学生;或者可以根据特定的语气或响应风格构建聊天应用程序。Phi-3-mini 模型于今年 4 月发布,共有 38 亿参数,上下文长度有 4K 和 128K 两个版本;Phi-3-medium 模型共有 140 亿参数,上下文长度同样有 4K 和 128K 两个版本

大模型将在医疗、教育领域发力,北京发布“人工智能 +”行动计划

感谢北京市发展和改革委员会、北京市经济和信息化局北京市科学技术委员会、中关村科技园区管理委员会今日发布了《北京市推动“人工智能 ”行动计划(2024-2025 年)》。《行动计划》提出了发展目标:2025 年底,通过实施 5 个对标全球领先水平的标杆型应用工程、组织 10 个引领全国的示范性应用项目、推广一批具有广泛应用前景的商业化应用成果,力争形成 3-5 个先进可用、自主可控的基础大模型产品、100 个优秀的行业大模型产品和 1000 个行业成功案例。率先建设 AI 原生城市,推动北京成为具有全球影响力的人工