资讯列表

用AI大模型「改造」QQ浏览器搜索,腾讯独家揭秘

1:引言自从搜索引擎问世以来,信息检索算法历经多次技术更迭,其演进的历程可大致归纳为四个技术代际:1.0 文本索引 -2.0 超链分析 -3.0 机器学习 -4.0 深度学习。2022 年底,ChatGPT 成为全球技术焦点,其具备的多轮对话、推理和对长文本的理解能力,解决了以往搜索引擎所无法有效解决的难题。然而,由于 GPT 目前还面临着许多挑战,例如大模型幻觉问题、高额的千次搜索成本、变现模式的颠覆以及法律的强监管等问题,各搜索引擎暂时都没有实现用 GPT 替换现有引擎。即使是 NewBing 也只是将传统的搜

中国科学院团队利用AI大模型训练技术解决同步辐射海量数据处理

编辑 | XX 射线叠层相干衍射成像(X-ray ptychography)是一种理论上能够实现衍射极限分辨率的相干衍射成像技术,已广泛应用于材料、生命、半导体、能源等多种科学领域研究。新一代同步辐射光源可提供高相干度和高亮度的X射线,推动相干成像技术向高通量多维度方向发展,使得 ptychography 在大体积样本的精细结构研究和功能表征方面具有极佳的应用前景。然而,新的实验模式与应用场景带来了海量数据在线解析的技术挑战,单次实验的原始衍射图谱数据量可达 PB 量级,成为第四代同步辐射光源上科学实验的最大数据源

港中大&之江实验室&华为&南医大提出逆向蛋白质折叠设计模型 ProRefiner

编辑 | 紫罗逆向蛋白质折叠(Inverse Protein Folding,IPF)是蛋白质设计的一项重要任务,其目的是设计与给定主链结构兼容的序列。尽管该任务的算法发展迅速,但现有方法在生成序列时往往依赖于位于局部邻域的噪声预测残基。为了解决这个限制,来自香港中文大学、之江实验室、华为诺亚方舟实验室和南京医科大学的研究团队,提出了一种基于熵的残差选择方法来消除输入残差上下文中的噪声。此外,研究还引入了 ProRefiner——一种内存高效(memory-efficient)的全局图注意力模型,可以充分利用去噪上

2023华为开发者大赛全球总决赛圆满收官,获奖名单揭晓

11月19日,以“创想无限”为主题的2023华为开发者大赛全球总决赛及颁奖典礼在华为松山湖基地圆满落幕。本届大赛开设云底座和产业两大赛道,覆盖中国以及亚太、拉美、欧洲、土耳其等区域,吸引了来自全球30多个国家和地区的19000多名开发者、3000多支团队报名参赛。在颁奖典礼上,华为颁发了3个金奖、6个银奖、9个铜奖、7个创新奖等超过25个奖项。2023华为开发者大赛全球总决赛大合照本届大赛自启动报名以来,备受全球各领域开发者关注,涌现了众多具有丰富想象力和创造力的优秀作品,包括应用华为云盘古大模型和IoT等能力的智

UX 专家出品!写给新人的 AI 入门基础

编者按:这篇文章出自用户体验行业的权威机构 NNGroup,UX/UI 设计师要如何使用AI,怎样入门,他们撰写了这份入门指南,以下为正文。 Jakob Nielsen 最近写道, UX 领域迫切需要与 AI 合作。一部分原因是「当前人工智能工具迫切需要提高可用性」 ,但同样重要的原因是 「适当使用人工智能可以极大地改善用户体验」。 幸运的是,用户体验设计社区的许多成员都同意并询问我们如何在用户体验工作中使用人工智能。Kate Moran 反过来问她的 LinkedIn 粉丝,他们会为那些 到现在都尚未在工作中使用

突发!OpenAI CEO Sam Altman被开除、退出董事会

Sam Altman 是拿到了乔布斯的剧本?自 ChatGPT 爆火以来,Sam Altman 也成为了 OpenAI 的门面以及代表性人物。这段时间以来,他一直活跃在宣传 OpenAI 与 ChatGPT 的舞台上,而 OpenAI 从估值到知名度也一直在蒸蒸日上。可以说 Sam Altman 与 OpenAI 这两个名字,有了极为深度的绑定。但令人惊讶与意外的是,今天 OpenAI 官方公告宣布:Sam Altman 将卸任首席执行官并退出董事会。临时接任他担任 CEO 的是 OpenAI CTO Mira M

13B模型全方位碾压GPT-4?这背后有什么猫腻

你的测试集信息在训练集中泄漏了吗?一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图所展示的,并且为了确保结果的有效性,这项测试还遵循了 OpenAI 的数据去污方法,更关键的是没有发现数据污染的证据。如果你细细查看图中的模型,发现只要带有「rephraser」这个单词,模型性能都比较高。这背后到底有何猫腻?原来是数据污染了,即测试集信息在训练集中遭到泄漏,而且这种污染还不易被检测到。尽管这一问题非常关键,但理解和检测污染仍然是一个开放且具有挑战性的难题。现阶段,去污最常用的方法是 n-gram 重叠

玩转围棋、国际象棋、扑克,DeepMind推出通用学习算法SoG

2016 年 3 月,一场机器人与围棋世界冠军、职业九段棋手李世石展开的围棋人机大战受到全球的高度关注。我们知道,最后的结果是 DeepMind 的机器人 AlphaGo 以 4 比 1 的总比分获胜。这是人工智能领域一个里程碑性的事件,也让「博弈」成为一个热门的 AI 研究方向。AlphaGo 之后,DeepMind 又推出了赢得国际象棋的 AlphaZero、击败《星际争霸 II》的 AlphaStar 等等。使用搜索和学习的方法,AI 在许多完美信息博弈中表现出强大的性能,而使用博弈论推理和学习的方法在特定的

GPT、Llama等大模型存在「逆转诅咒」,这个bug该如何缓解?

我们是否正在掉入中等智能陷阱?一个关于大语言模型 “逆转诅咒” 的分析与缓解方法。来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction causal language model 的本质缺陷,并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒” 显示出更强的鲁棒性。通过将双向注意力机制引入 Llama 模型进行微调,该研究实现了对 Llama 的 “逆转诅咒” 的缓解。该研究认为当前主流的这种大模型结构与训练范式存在着很多潜在

AndesGPT加潘塔纳尔:生成式AI端侧落地,OPPO给了我们答案

自研系统加大模型,新一代手机的标配?自 ChatGPT 问世已来,我们正在见证新的技术革命,手机厂商更是纷纷高调宣称正在部署大模型,生成式 AI 的竞争已经跨过前期积累,进入到了技术应用的新阶段。11 月 16 日,OPPO 开发者大会 ODC 2023 上,大模型加持的 ColorOS 14 正式亮相。为了让生成式 AI 融入人们的日常生活,OPPO 将 AndesGPT 与自研智慧跨端系统「潘塔纳尔」实现了深度协同,也让我们看到了手机厂商对大模型的思考。自研潘塔纳尔系统加大模型不一样的智慧融合据介绍,OPPO

Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制

生成式 AI 进入视频时代了。提到视频生成,很多人首先想到的可能是 Gen-2、Pika  Labs。但刚刚,Meta 宣布,他们的视频生成效果超过了这两家,而且编辑起来还更加灵活。这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出,Meta 的技术既支持灵活的图像编辑(例如把「兔子」变成「吹小号的兔子」,再变成「吹彩虹色小号的兔子」),也支持根据文本和图像生成高分辨率视频(例如让「吹小号的兔子」欢快地跳舞)。其实,这其中涉及两项工作。灵活的图像编辑由一个叫「Emu Edit」的模型来完成。

数智上海2023峰会将于12月举办,邀各界共享数字化转型最新成果与经验

数字技术创新和数字经济发展已经成为推进新型工业化的加速器,为经济高质量发展注入强劲动能、形成强力支撑。为了进一步推广上海数字化转型最新成果与可行性经验,助力数字技术交流与科技创新合作,「2023 上海数字化转型体验周」期间将举办首届「数智上海 2023 峰会」。以「数字化转型推进新型工业化」为主题,「数智上海 2023 峰会」将于 12 月中旬在上海杨浦举办。峰会将设置多场聚焦前沿数字技术创新与应用赋能的活动,并进行多项重磅发布,邀请众多政府领导、院士专家、数字化转型场景方与技术方企业代表,带来一场顶级智慧与前瞻思

解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了

这篇文章给出了大模型 FP 量化的解决方案。大语言模型 (LLM) 压缩一直备受关注,后训练量化(Post-training Quantization) 是其中一种常用算法,但是现有 PTQ 方法大多数都是 integer 量化,且当比特数低于 8 时,量化后模型的准确率会下降非常多。想较于 Integer (INT) 量化,Floating Point (FP) 量化能更好的表示长尾分布,因而越来越多的硬件平台开始支持 FP 量化。而这篇文章给出了大模型 FP 量化的解决方案。文章发表在 EMNLP 2023 上

保姆级教程!Stable Diffusion LoRA模型训练教程(新手篇)

本篇文章仅整理归纳我的LoRA训练思路及步骤,以及自己遇到的问题和解决方案的复盘整理。希望对新手炼丹师们有所启发和帮助。 LoRA 相关干货:

哼两句就能变歌曲,还有国宝歌手帮你演绎,音乐 Dall·E 2 时刻来了

机器之能报道编辑:Sia一个模型 两个功能=仅从文本提示就能生成引人入胜的音乐和歌声。你是否有过这样的体验,脑海不时冒出各种旋律,却因对乐器一窍不通,无法将这些创意释放出来?今天 ,YouTube 和 Google DeepMind 强强联合推出的新服务能让你的创意和音乐实现无缝转化。在 Google DeepMind 提供的最复杂的 AI 音乐生成系统 Lyria 帮助下,YouTube 正在测试新的音乐生成功能:仅用文本提示或者简单哼唱几句,AI 就能立刻生成一段引人入胜的音乐或歌曲。最先推出的一个服务叫 Dr

通过深度学习预测离散时间分岔

编辑 | 白菜叶许多自然和人造系统都容易发生关键转变——动态方面的突然且可能具有破坏性的变化。深度学习分类器可以通过从大型模拟训练数据集中学习分叉的通用特征,为关键转变提供预警信号。到目前为止,分类器仅被训练来预测连续时间分岔,忽略了离散时间分岔所特有的丰富动态。在这里,麦吉尔大学(McGill University)Thomas M. Bury 的研究团队训练一个深度学习分类器,为余维一的五个局部离散时间分岔提供预警信号。他们使用生理学、经济学和生态学中使用的离散时间模型的模拟数据以及经历倍周期分岔的自发跳动的鸡

2023 戈登贝尔奖揭晓:Frontier 超算「量子级精度」材料模拟获奖

编辑 | 泽南、杜伟戈登贝尔奖(ACM Gordon Bell Prize)设立于 1987年,由美国计算机学会颁发,被称为超算界的「诺贝尔奖」。该奖项每年颁发一次,用以表彰高性能计算领域取得的杰出成就。奖金 1 万美元,由高性能和并行计算领域先驱戈登·贝尔提供。近日,在全球超级计算大会 SC23 上,2023年ACM 戈登贝尔奖授予了美国和印度研究人员组成的 8 人国际团队,他们实现了大规模量子精度的材料模拟。相关项目名称为「量子精度的大规模材料建模:金属合金中准晶体和相互作用扩展缺陷的从头计算模拟」。团队成员分

台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟

编辑 | 萝卜皮全球中期天气预报对于许多社会和经济领域的决策至关重要。传统的数值天气预报使用增加的计算资源来提高预报精度,但无法直接使用历史天气数据来改进基础模型。Google DeepMind 团队介绍了「GraphCast」,一种直接从再分析数据训练的基于机器学习的方法。它可以在一分钟内以 0.25° 的分辨率预测全球 10 天内的数百个天气变量。研究人员用 1380 个验证目标进行了测试,GraphCast 在 90% 的验证目标中显著优于当前最准确的操作确定性系统,其预测支持更好的严重事件预测,包括热带气旋