应用
DeepL 推出新一代翻译编辑大型语言模型:译文受青睐度达 ChatGPT-4 的 1.7 倍
以其同名机器翻译器闻名的语言人工智能公司 DeepL 德国当地时间昨日宣布推出新一代面向翻译和编辑应用的大型语言模型。DeepL 宣称基于新模型的译文受语言专家的青睐程度是谷歌翻译的 1.3 倍,ChatGPT-4 的 1.7 倍,微软翻译的 2.3 倍。DeepL 的新模型基于这家企业在过去七年中积累的训练语料,采用先进大型语言模型技术,并获得了数千名语言专家的“辅导”,专为内容创建和翻译打造。DeepL 指出,在进行英日和英中互译时,新模型相较旧模型在质量上得到了 1.7 倍的显著改进;此外英德互译的质量也提高
百度网盘推出 AI 英语学习微信小程序“盘盘单词”,会员月卡 9.9 元、年卡 39.9 元
AI在线从百度网盘获悉,百度网盘推出 AI 英语学习工具“盘盘单词”,已在微信小程序上线。官方号称“盘盘单词”可以让用户“丢掉单词书,用你的照片学英语”。官方表示,“盘盘单词”可利用生成式 AI 技术,从用户照片中提取关键元素,自动生成与用户实际生活相关联的英语单词与例句,帮助用户加深记忆效果。“盘盘单词”普通用户每日限量 20 张照片,会员用户无限次使用,会员月卡 9.9 元、年卡 39.9 元。百度网盘称“盘盘单词”基于千帆大模型,能够通过不断优化学习算法,结合用户的学习进度和反馈进行动态调整,确保复习计划和背
李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局
今日融资快报李飞飞旗下AI初创企业World Labs估值已超10亿美元英国《金融时报》报道,著名华裔计算机科学家李飞飞创办的World Labs估值已经赶超10亿美元。 该创企主要利用类似人类的视觉数据处理技术,使AI具备高级推理能力。 据知情人士透露,从今年4月成立至今,World Labs已经进行了两轮融资,投资方包括顶级科技投资者Andreessen Horowitz和AI基金Radical Ventures。
对话南洋理工大学安波教授:如何让大语言模型适应动态环境?丨IJAIRR
对人类越是简单的问题,大语言模型反而越难以做好? 尽管现在的大模型已经有能力冲击数学竞赛级别的题目,但在像“9.11和9.9谁大”这样的简单问题上仍然会翻船。 而从推特上网友对问题的讨论中猜测,出现这种错误的原因可能是由于大模型以token的方式来理解文字,当9.11被拆成“9”、“.”和“11”三部分时,11确实比9大。
微软发布 iOS / 安卓正式版 Designer 应用:可 AI 修图、生成贺卡等
感谢在经历了长达近 1 年的预览测试之后,微软公司正式在苹果 iOS 平台、谷歌安卓平台推出 Microsoft Designer 应用,让 iPhone 和安卓手机用户体验 AI 修图等功能。微软公司表示 Microsoft Designer 应用已全平台上线,目前已经推出 iOS、Android、Windows 以及网页版本,用户可以根据使用场景,跨平台继续推进 AI 项目。AI在线附上微软官方说明如下:释放你的创造力 - 通过 AI 以直观方式创建、设计和编辑可想象出的任何内容。使用生成式 AI 的强大功能,
三星中国Galaxy Z系列新品接入豆包大模型
7月17日,三星电子面向中国市场发布新一代 Galaxy Z系列产品。会上,三星电子与火山引擎官宣合作,为Galaxy Z Fold6、Galaxy Z Flip6手机的智能助手和AI视觉接入豆包大模型,提升手机的智能应用体验。此前,三星在海外新品发布会上公布了与谷歌Gemini的深度合作,在中国区则选择了火山引擎等厂商作为大模型合作方。图说:三星Galaxy Z Fold6、Galaxy Z Flip6手机的智能助手和AI视觉接入豆包大模型除了画圈即搜、实时翻译、录音转录等已经披露过的AI功能外,本次中国地区发布
因监管问题,Meta 将不会在欧盟发布新的多模态 AI 模型
据 Axios 报道,Meta 在一份声明中表示,他们即将发布一个多模态的 Llama 模型,但由于监管环境的不确定性,该模型不会在欧盟发布。Meta 表示,这一决定也意味着即使在开放许可下发布,欧盟的客户和公司也无法使用多模态模型,Meta 将向欧盟的客户和公司提供仅支持文本(text only)的 Llama 3 模型。报道称,Meta 的问题不在于《人工智能法案》,而在于如何在遵守《通用数据保护条例》(GDPR)的同时,使用欧盟客户的数据来训练模型。Meta 表示使用当地数据进行训练,对于确保其产品正确反映该
消息称阿里通义千问大模型技术负责人周畅将离职创业
感谢据 36 氪报道,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。报道称,周畅目前还在阿里云系统中,尚未正式离职。但该媒体从多方独立信源处得知,周畅已确定要创业。一位消息人士表示,周畅或将投身于 AI 应用领域。而另一位知情人士表示,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云 CTO 周靖人。截至AI在线发文,阿里云官方尚未进行回应。通义千问于 2023 年 4 月首次公布,目前已更新到 2.5 版本,号称
谷歌发布 Oscar 服务,帮助开发者通过 AI 智能体掌控开源软件项目
感谢谷歌公司今天发布新闻稿,宣布推出 Project Oscar 项目,帮助开源开发团队使用和创建 AI 智能体(Agent)来管理软件项目。谷歌在印度班加罗尔举办了 2024 I / O Connect 开发者活动,旗下 Go 语言开发团队推出了 Project Oscar 项目,通过构建 AI 智能体开源平台,可以帮助软件产品团队监控开发过程中的问题或错误。这些 AI 智能体可部署在开发、规划、运行或者售后支持等方面,开发者无需重新编写任何代码,可以通过自然语言进行交互。谷歌开源编程语言 Go 的产品经理卡梅隆
SD WebUI 手把手教程!5 步搞定黑白照片修复、上色和高清放大
大家好,这里是和你们一起探索 AI 花生。
上次为大家推荐了 9 款在线免费的 AI 工具,可以帮我们一键完成老照片修复/上色的工作。但是这些工具大多有使用次数、图像尺寸方面的限制,处理效果并不能完全让人满意。而随着 AI 绘画的普及,我们可以借助 SD Web UI 这样的开源工具,免费实现黑白照片修复、上色、高清放大等一系列操作,不仅可以没有使用上的各种限制,图像的修复、上色效果也更准确精致。整个过程大概分为 “面部强化-破损修复-上色-高清放大” 四个步骤,如果你还不了解 SD WebUI 的用法,可以了解我
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(三)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、Apply Cont
全网祝贺!Andrej Karpathy官宣创业:是自己热爱的AI+教育
Karpathy:以前在特斯拉、OpenAI都是「副业」,现在做的才是「正职」。刚刚,Andrej Karpathy在X平台宣布了自己的下一站去向:创办一家名为 Eureka Labs 的人工智能 教育公司。很高兴与大家分享,我正在创办一家名为 Eureka Labs 的人工智能 教育公司。公告如下:我们是 Eureka Labs,我们正在打造一所AI原生的新型学校。我们如何才能获得学习新知识的理想体验?例如,在物理学方面,我们可以想象与费曼(Feynman)一起学习高质量的课程材料,费曼会在每一步都为你提供指导。
研究:生成式 AI 更像是记忆大师而非推理高手
生成式 AI 的迅猛发展和广泛应用引发了诸多担忧,从隐私安全到潜在的失业危机。虽然 AI 聊天机器人如 ChatGPT 和微软 Copilot 在短短时间内取得了惊人进步,能够写代码、纠错甚至挑战人类创意,但它们真的像表面看起来那么聪明吗?麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项最新研究指出,这些强大的大型语言模型(LLM)似乎更依赖记忆而不是真正的推理能力。它们在熟悉的任务上表现出色,但在面对新问题时却显得力不从心。AI在线注意到,研究人员通过对比 AI 在不同任务上的表现得出这一结论。例如,G
AKOOL助力戛纳广告大奖,发布革命性实时数字人平台
2024年欧洲杯如火如荼进行之际,一则由法国电信公司 Orange 创作的足球比赛视频也迅速走红。视频中,我们看到了姆巴佩、吉鲁、格里兹曼......,实际上,所有在球场上奔跑的运动员都不是真人,而是人工智能生成的虚拟角色。凭借出色创意和独特性,该作品斩获了广告创意营销界“奥斯卡”——今年的戛纳国际创意节的体育类大奖。而 AKOOL 为这一大奖作品提供了核心技术支持。他们开发的 AI 面部捕捉系统能精确捕捉人脸细微表情和动作,在精心设计的渲染技术加持下,作品中的虚拟人物几乎以假乱真。这种影像级别的视觉效果,足以满足
特朗普遇刺照,用一张2100元?! 文章标题、配图,AI免费给你来一打
机器之能报道编辑:Sia大模型替代编辑小助理,比萝卜快跑替代司机,靠谱得多。据说,自媒体使用特朗普遇刺照片作为配图,一张付费 2100 元!随便下一张图片给文章配图的日子,一去不复返咯。不过,创作者们的麻烦并未到此为止。写完一篇公众号文章,接下来的十几分钟最让人抓耳挠腮:标题铺位,黄金地段,寸土寸金。除了突出内容亮点,还要确保标题足够吸引人点开看,这可比写文章难多了!啥?酒香不怕巷子深?在红海的公众号圈子里,这条行不通。也别灰心!磨合一段时间,我们发现,大模型在解决这两个日常挑战上,还挺管用。-1-最短时间起一个合
早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL
arXiv 不是同行评审期刊,所以发在 arXiv 上的论文不必被引用,这合理吗? 如果你对 AI 智能体感兴趣,那你一定知道微软的 AutoGen。它是一个用于构建 AI 智能体的开源编程框架,允许多个智能体通过聊天来解决任务。其间,LLM 智能体可以扮演多种角色,如程序员、设计师,或者各种角色的组合。在 GitHub 上,这个项目已经收获了 28k 的 star 量,论文还在 ICLR 2024 LLM Agent Workshop 上获得了最佳论文奖。不过,这篇论文的背后其实是存在争议的。2023 年 1
快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移
近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。如下动图所示: 来自网友测试LivePortrait 来自网友测试LivePortrait快手开源的LivePortrait对应的论文题目为:《 LivePortrait: Efficient Portrait Ani
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽 Mistral AI 发布了一个专注于数学推理和科学发现的7B大模型「Mathstral」,来解决需要复杂、多步骤逻辑推理的高级数学问题。该