提示

不停PUA大模型「写更好点」,无需其它花哨技术就能让AI代码水平暴增

AI 的编程能力已经得到了证明,但还并不完美。 近日,BuzzFeed 的资深数据科学家 Max Woolf 发现,如果通过提示词不断要求模型写更好的代码(write better code),AI 模型还真能写出更好的代码! 这篇文章在网络上引发了热议,著名 AI 科学家在看完这篇文章中更是发出了 matters 三连:迭代很重要,提示词设计很重要,代码执行能力很重要。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域,其目标是实现先进的加速器技术和尖端的高影响力应用,例如物理发现、癌症研究和材料科学。 但是,自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。 德国亥姆霍兹协会旗下 DESY(Deutsches Elektronen Synchrotron)的研究人员建议使用大型语言模型(LLM)来调整粒子加速器。

Sora上线即翻车?知名科技博主一手评测

AI好好用报道编辑:杨文终于识得Sora真面目。 Sora 千呼万唤始出来。 10 日凌晨,OpenAI 直接开放了 Sora 的新版本 ——Sora Turbo,ChatGPT Plus 和 Pro 用户可以直接上手体验。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

最近的文本到图像生成器由文本编码器和扩散模型组成。 如果在没有适当安全措施的情况下部署,它们会产生滥用风险(左图)。 我们提出了潜在保护方法(右图),这是一种旨在阻止恶意输入提示的安全方法。

OpenAI 推出 meta-prompt 工具,AI 时代让你掌握提示词艺术

AI 时代,你和他人的差异可能直接体现在如何提出合适的提示词(Prompt)上。科技媒体 The Decoder 昨日(10 月 11 日)发布博文,报道称 OpenAI 更新提示词优化功能 Playgound,新增引入“元提示”(meta-prompt)工具。“元提示”(meta-prompt)工具主要帮助用户更高效地创建、改进针对大型语言模型(LLMs)的提示,节省开发高质量 AI 提示的时间。

OpenAI ChatGPT 新增自动模式,基于提示词复杂度灵活选择合适 AI 模型

科技媒体 testingcatalog 昨日(9 月 18 日)报道,OpenAI 面向所有用户在多种设备上,为 ChatGPT 推出了“Auto”自动模式。AI在线注:用户切换选择 Auto 之后,会自动根据用户输入的提示词复杂程度,自动选择最合适的 AI 模型。对于复杂的提示,它会选用最先进的模型,而对于较简单的提示,则采用更快的模型以节省时间。许多用户反馈表示,在大多数情况下,他们更倾向于与最先进的模型进行交互。然而,在某些特定场景下,能够选择优化速度被视为一项有价值的功能。

网信办发布《人工智能生成合成内容标识办法(征求意见稿)》

感谢国家互联网信息办公室今日发布关于《人工智能生成合成内容标识办法(征求意见稿)》公开征求意见的通知。其中第四条提到,服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识。(一)在文本的起始、末尾、中间适当位置添加文字提示或通用符号提示等标识,或在交互场景界面或文字周边添加显著的提示标识;(二)在音频的起始、末尾或中间适当位置添加语音提示或音频节奏提示等标识,或在交互场景界面中添加显著的提示标识;(三)在图片的适当位置添加显著的提示标识;

OpenAI大秀肌肉,一口气放出10个新模型Demo,全球网友玩疯了

AI好好用报道编辑:杨文9.11和9.8哪个大还是答不对。9 月 13 日凌晨,OpenAI 又搞了个大新闻 ——推出 o1 系列模型,也就是江湖流传已久的「草莓」。这款模型到底厉害在哪,能让朋友圈刷了屏?这么说吧,它不需要专门训练,就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。(查看详情,请移步:刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限)不过,实现通用复杂推理的代价是,每次回答要花费更长时间思考。因为 o1 是经过强化学习训练的新型语言模型,在输出回答之前,它会

哈佛反向学习法火了:教会 AI 就是教会自己,陶哲轩力荐

数学大佬陶哲轩力荐,哈佛反向学习法火了:教会 AI 就是教会自己。他最新分享了哈佛应用数学和应用物理学教授 Michael P. Brenner 的一个教学方法 ——利用提示工程,让学生尝试教 AI 完成平时数学作业(不纳入正式考核),期末再让这些 AI 参加考试。好嘛,相当于学生再把 AI 当学生,俄罗斯套娃有。Michael P. Brenner 教授认为,这一方法能够教会学生拆解问题,并深度掌握提示词工程技术。学生在教 AI 时需要自己理解问题,他们将问题分解为小步骤的过程本身就是一项极好的锻炼。而且,学会提

Anthropic 公开 Claude AI 模型的系统提示词

科技媒体 Techcrunch 昨日(8 月 26 日)报道,Anthropic 公司公开了 Claude AI 模型的“系统提示词”(system prompts)。系统提示词(System prompt)为了让 AI 模型更好地理解人类指令,提示词(Prompt)工程实际上包含 2 层核心内容,用户提示词(User prompt)和系统提示词(System prompt):用户提示词:用户输入的提示词,然后 AI 模型基于用户提示词生成答案。系统提示词:这是由系统生成的提示,通常用于设定对话的背景、提供指导或规

苹果 Apple Intelligence 被挖出重大安全缺陷,几行代码即可攻破

Apple Intelligence 上线在即,一小哥几行代码曝出 Apple Intelligence 安全缺陷。在 2024 年全球开发者大会 (WWDC) 上,Apple 发布了将搭载在 iOS 18.1 中的 AI 功能 Apple Intelligence。眼看着 10 月即将正式上线了,有「民间高手」在 macOS 15.1 提供的 Beta 测试版 Apple Intelligence 中发现重大缺陷。开发人员 Evan Zhou 使用提示注入成功操纵了 Apple Intelligence,绕过了预

关于大模型「越狱」的多种方式,有这些防御手段

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]作者:罗昊京(Financial Quantitative Analyst)此项目是由伊利诺伊大学香槟分校(UIUC)的汪浩瀚教授主导,汇集了多名intern的共同努力而成。长久以来,这个

大模型集体“失智”:9.11 和 9.9 哪个大,几乎全翻车了

没眼看……“9.11 和 9.9 哪个大”这样简单的问题,居然把主流大模型都难倒了??强如 GPT-4o,都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版,同样的口径。新王 Claude 3.5 Sonnet,还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的,但下一步突然就不讲道理了如上所示,9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗?这你还解释啥啊解释,简直要怀疑是全世界 AI 联合起

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

六位一线 AI 工程师分享自身总结,公开大模型应用摸爬滚打一年心得

六位一线 AI 工程师和创业者,把在大模型应用开发上摸爬滚打一整年的心得,全!分!享!了!(奇怪的六一儿童节大礼包出现了)这篇干货长文,一时间成为开发者社区热议的话题。有网友评价为,大模型领域少有的“有操作性”的实用见解,非常值得一读。这 6 位作者来自不同背景,比如有大厂工程师,也有独立开发者,还有咨询顾问。但他们的共同之处,是过去一年里一直在大模型之上构建真实应用程序,而不只是炫酷的 Demo 演示,他们认为:现在正是非机器学习工程师或科学家,也能把 AI 构建到产品中的时候。在他们的一系列分享中,网友热议的亮

「Sora平替」来了!一键生成5秒视频,还免费,我们实测:很顶!

机器之能报道编辑:山茶花人家主打一个免费,还要啥自行车。自 Sora 发布以来,AI 圈掀起一场轰轰烈烈的文生视频革命。例如,Lightricks 推出生成式 AI 视频讲故事平台 LTX Studio,Genmo 融资 3000 万美元躬身入局,还有上周谷歌兴奋发布的 Veo…… 无一例外,都打着「对标 Sora」的旗号。最近,AI 文生视频领域又迎踢馆者 ——Viva,号称「让每一刻都栩栩如生」。该应用不仅可以文生视频、图生视频,还支持 4K 分辨率放大功能。其中文生视频可生成 5 秒视频,图生视频则为 4 秒

语音合成之王ElevenLabs搅局音乐界,新模型创作水准堪驰援《歌手》

机器之能报道编辑:Cardinal一个简单提示,二十几个词,就能生成一首三分时长的歌曲,其水准足以打榜。很多人制作视频时,喜欢强强联合——用 Suno、Udio 生成背景音乐,ElevenLabs 负责旁白。前者是逼真的 AI 音乐创作工具,ElevenLabs 则是目前最著名、最好的 AI 声音生成平台之一。但现在,格局要生变了。最近,ElevenLabs 又推出一款新型 AI 音乐生成器,进军音乐界。听闻音频之王也要「通吃」音乐之王,很多人的反应都在演我:ElevenLabs 在 X 上展示了新模型创作的一些曲

一个小技巧,解锁 ChatGPT「预测未来」?

【新智元导读】新研究利用了 ChatGPT 在 2021 年 9 月的训练数据截止这一限制,比较了 ChatGPT 在直接预测和未来叙事预测两种不同提示方式下,预测 2022 年各种事件上的表现。结果显示,未来叙事预测方法在预测 2022 年奥斯卡奖得主时表现出色,在预测宏观经济变量时,ChatGPT-4 的表现也有所提高。如今,AI 进步的速度,已经超出了我们对它用途的理解。为了防止 ChatGPT「失控」,OpenAI 定制了一套堪称严苛的「服务条款」,涉及包括法律、医疗 / 健康、个人安全、权利福祉、赌博放贷