应用
LG 新能源将使用 AI 为客户设计电池单元,一天就能搞定
韩国电池供应商 LG 新能源 (LG Energy Solution) 将采用人工智能 (AI) 技术为客户设计电池。得益于此,LG 新能源能够在一天之内设计出根据客户规格定制的电池单元。LG 新能源的 AI 电池设计系统基于该公司过去 30 年的数据,在 100,000 个设计案例中进行了训练。LG 新能源的一位代表表示,公司的人工智能电池设计系统可以确保客户快速且一致地获得高质量的电池设计方案,“这项技术的最大优势在于,无论设计人员的熟练程度如何,都能以一致的水平和速度完成电池设计。”据AI在线了解,电池设计通
YouTube 推出新规:用户可要求平台下架模仿自己面部、声音的 AI 合成内容
随着 AI 生成影音内容的普及,YouTube 也随之进行了一些政策调整。据 PhoneArena 当地时间 13 日报道,用户现可要求 YouTube 下架由 AI 生成的模仿自己面部、声音的视频。这一请求将根据 YouTube 的隐私请求流程提出,而不是像 deepfake 那样因为具有误导性而要求将其删除。YouTube 表示,申诉要求下架的主因是影片伤害当事人的“隐私权”,而且只有主要当事人才能要求删除,而不是因为深伪技术及误导性内容。图源 PixabayYouTube 方面称,平台将根据多种因素来决定是否
PyTorch 团队首发技术路线图,近百页文档披露 2024 下半年发展方向
最近,PyTorch 团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。如果你在 AI 领域用 Python 开发,想必 PyTorch 一定是你的老朋友之一。2017 年,Meta AI 发布了这个机器学习和深度学习领域的开源库,如今已经走到了第 7 个年头。根据 Assembly AI 2021 年的统计数据,HuggingFace 上最受欢迎的 top 30 模型都能在 PyTorch 上运行,有 92% 的模型是 PyTorch 专有的,这个占比让包括 Tensor
商汤大模型的「5o」交互,普通人如何和 AI 过一天?
在商汤的演示下,日日新5o拥有像人一样的实时视觉能力,可以跟人进行流畅的视频交互——能听、能说、能看、无延时,它可以通过摄像头 语音实现和用户的实时交互,并获知用户所在的真实场景下的各种状态信息,打破了与AI交互的次元壁,实现了与AI的“视频通话”,已经具备真人聊天般的交互体验。 两个月前OpenAI推出了GPT-4o,以突破性的智能交互能力,彻底颠覆了我们对AI语音助手的认知,颠覆了过去的人机交互,给业界带来又一次震撼。 震撼之外,中国大模型界对GPT-4o的认知似乎并不如GPT-4那么统一,有人认为「在实现AGI的路上,GPT-4o并不重要」、有人评价「在技术突破上,GPT-4o没那么惊艳」;有人认为GPT-4o的发布是 AI 2.0 时代的标志性事件,会催生全新的应用平台和商业模式。
百度推出仿真人 AI 社交 App“文小言”:可与虚拟角色互动并建立情感连接
据 Tech 星球上周末报道,百度近期上线了一款名为“文小言”的 AI 数字人社交 App,其基于文心大模型技术打造,是一款与 AI 虚拟角色进行实时沟通、互动并建立情感连接的人工智能应用服务。根据该媒体发布的使用体验来看,该 App 在玩法和功能上相比同类型 AI 聊天产品无较大区别,但由于采用仿真的数字人作为“AI 社交对象”,因此交互“更具真实感”。同时,该 App 内置的数字人在肢体语言动作上仍稍显不流畅。此外,该 App 不支持创建专属的数字人。用户可在该 App 的“发现”功能栏内寻找所需的数字人聊天对
传 4050 亿参数版 Llama3 将在 23 日发布;机械臂公司获 6300 万美元融资丨AI情报局
今日融资快报机械臂公司 Standard Bots 获 6300 万美元融资,亚马逊、三星等参投Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司,该公司已获得 6300 万美元的 B 轮新资金。 本轮融资由 General Catalyst 领投,亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。
谷歌 Gemini 被曝今日起推出多项新功能:定制 GPT、记忆或个性化回复等
根据反向工程师 @testingcatalog 的发现,谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看,这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送,但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日(AI在线注:日期即今日,但以具体时区为准),预计当天将带来 1 项功能。而在 7 月 18 日,谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能,但未说明这些功能的具体上线日期。文生图工具 I
AI告别鬼画符!快手可图和国外写字小能手Ideogram打擂台,谁更牛?
机器之能报道编辑:杨文快手AI,步履不停。最近,快手出尽风头。OpenAI 当家花旦 Sora 的公测还遥遥无期,快手就率先祭出了可灵。凭借其逼真、高清、不输 Sora 的视觉效果,一下子成了全球网友的新宠。据快手称,可灵申请用户数量已经接近 70 万,目前已开放给超 30 万用户使用。趁着热乎劲,快手又马不停蹄地上线了可灵网页版。老铁们拿它各种整活儿 ——蒙娜丽莎戴墨镜:容嬷嬷喂紫薇吃鸡腿:大胖橘端着高脚杯、翘着兰花指喝红酒:甚至还给肯德基来了一波广告植入:不过呢,今天我们不聊可灵,而是唠唠快手的另一款明星产品
谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档
感谢据 X 用户 @Kevin Bankston 的报告,谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到,Bankston 在其推文中详细描述了这一问题。最初,他发现 Gemini 似乎在阅读他的 Google Drive 文档,但相关设置中找不到禁用该功能的选项。经进一步调查,他发现这是 Google Drive 本身的问题,而非 Google Docs,但两者可能都存在类似的漏洞。而且,根据 Gemini 人工智能的说法,用于控
研究:AI 测谎能力比人类更强,但会对社会交往造成影响
德国维尔茨堡大学当地时间 12 日公布的最新研究显示,在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代,人工智能在测谎方面的表现比人类更佳。图源 Pixabay来自维尔茨堡、杜伊斯堡、柏林和图卢兹的研究人员探讨了 AI 在检测谎言方面的有效性及其对人类行为的影响。这项研究的主要发现可以总结如下:在基于文本的谎言检测中,AI 的准确性优于人类。没有 AI 的支持,人们不愿指责他人撒谎。在 AI 的支持下,人们更有可能表达对遇到谎言的怀疑。只有大约三分之一的研究参与者会利用向 AI 询问评估的机会。然而,大多数人
全国高校首个,山东财经大学发布新文科教育教学专有大模型“AI 才”
AI在线从山东财经大学获悉,7 月 11 日,该校发布了全国高校首个新文科教育教学专有大模型 ——“AI 才”教育教学专有大模型,该模型由学校与百度智能云、山东银瑞科技合作共同开发。据介绍,该大模型可通过大数据、机器学习、知识图谱等关键技术,搭建智能科教环境,打造具有专业性、个性化、系统性、一站式特点,集“知”“教”“学”“研”“训”“智”为一体的教学科研服务平台。该大模型具备如下功能及特性:“知识数字化”板块:可在大模型平台上进行专业教材、科研数据、实习实训案例等知识的规范化、结构化梳理和沉淀,形成自有知识库,实
“知乎AI先行者沙龙”深圳站:探航大模型应用新风口
7月14日,第三届“知乎AI先行者沙龙”在深圳举行。 知乎邀请众多AI行业从业者、专家、学者齐聚一堂,用最前沿的观点和最专业的思考,共同探讨大模型应用的新风口。 本届沙龙以“探航”为主题,知乎高级副总裁、社区业务负责人张荣乐出席活动并致辞,香港大学计算与数据科学学院院长马毅、RWKV元始智能联合创始人罗璇、粤港澳大湾区数字经济研究院基础软件中心首席科学家张宏波、OPPO AI 中心技术战略规划总监陈晓春,分别围绕人工智能的本质、端侧模型与硬件的结合等议题进行主题演讲。
阿里妈妈给出了什么样的赛题,被顶会NeurIPS 2024 pick了?
会「出价」也是个很实用的技能。在众多人工智能顶会中,NeurIPS 属于什么段位?有人将其代入《甄嬛传》宇宙做了张图:大概配享「后位」。 图源:小红书用户 @云卷月舒这一排名可能存在争议,但毋庸置疑的是,NeurIPS 在 AI 顶会中始终稳居前三,并且长期处于 Google Scholar 全球所有学科期刊、顶会的前十名。因此,能够在这一会议中发表论文是众多 AI 研究者的共同目标。开创性的 Al
赶时髦的 AIGC 营销人,如何实现「里子」与「面子」的双赢?
过去一年,AI 在各行各业掀起了一场技术变革狂潮。向来「赶时髦」的营销圈,更是率先拥抱 AIGC 技术。相关数据显示,2023年,我国已有近半数广告主企业在线上营销活动中应用 AIGC 技术,其中超过 90% 的应用聚焦于内容创作和创意开发。这种由技术驱动的广告营销新模式正在逐渐成型,为广告主降本增效带来更多可能。然而,AIGC 技术在营销领域大施拳脚的同时,也伴随着诸多挑战。例如,AIGC 技术在生成营销素材时可能会产生内容风险,重金投入的营销活动一不小心为黑产做了嫁衣……那么,AIGC 营销人该如何平衡创作内容
微软开源的GraphRAG爆火,Github Star量破万,生成式AI进入知识图谱时代?
知识图谱从不退环境!LLM 很强大,但也存在一些明显缺点,比如幻觉问题、可解释性差、抓不住问题重点、隐私和安全问题等。检索增强式生成(RAG)可大幅提升 LLM 的生成质量和结果有用性。本月初,微软发布最强 RAG 知识库开源方案 GraphRAG,项目上线即爆火,现在星标量已经达到 10.5 k。项目地址::,它比普通的 RAG 更强大:GraphRAG 使用 LLM 生成知识图谱,在对复杂信息进行文档分析时可显著提高问答性能,尤其是在处理私有数据时。
MotionClone:无需训练,一键克隆视频运动
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。论文::: MotionClone 的新框架,给定任意的参考视频,能够在不进
谷歌 DeepMind 被曝抄袭开源成果,论文还中了顶流会议
大模型圈再曝抄袭大瓜,这回,“被告”还是大名鼎鼎的谷歌 DeepMind。“原告”直接怒喷:他们就是把我们的技术报告洗了一遍!具体是这么个事儿:谷歌 DeepMind 一篇中了顶流新生代会议 CoLM 2024 的论文被挂了,瓜主直指其抄袭了一年前就挂在 arXiv 上的一项研究。开源的那种。两篇论文探讨的都是一种规范模型文本生成结构的方法。抓马的是,谷歌 DeepMind 这篇论文中确实明晃晃写着引用了“原告”的论文。然鹅,即便是标明了引用,“原告”的两位论文作者 Brandon T. Willard(布兰登)和
直击真实的甲方AGI需求,人工智能赋能产业融通发展论坛顺利召开
7月6日,「2024 WAIC 人工智能赋能产业融通发展论坛」在世博展览馆隆重举行。本次论坛主要议题为探讨人工智能赋能新型工业化、促进产业融通发展的相关问题,包括领导致辞、签约仪式、主题演讲、央国企人工智能场景需求发布和圆桌论坛等多个环节。众多来自央国企机构和人工智能领域的企业参与,包括中国电子信息产业发展研究院、中国移动研究院、中国石化胜利油田、国家电网客服中心、中电昱创、南方电网数字电网集团、达摩院、百度智能云、创新奇智等。出席嘉宾围绕人工智能在不同领域的应用实践、大模型的发展与应用、智能化运维、人工智能赋能产