应用
面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机
感谢面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30 种语言,宣称可实现:最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4VOCR 能力 SOTA(IT之家注:State-of-the-Art):9 倍像素更清晰,难图长图长文本精准识别图像编码快 150 倍:首次端侧系统级多模态加速▲ OpenCompass 模型量级对比MiniCPM-Llama3-V 2.5 总参数量为 8B,多模态综合性能超越 GPT-4V-1106、Ge
联想与高通推出微软Copilot+PC,配备最强AI NPU
5月21日,联想集团推出首款搭载高通骁龙X Elite的下一代Copilot PC——联想Yoga Slim 7x和联想ThinkPad T14s Gen 6。随着PC行业进入人工智能时代的新阶段,联想将在PC产品组合中提供更高水平的个性化个人计算,智能软件驱动的本地任务处理,以及更高的生产力、创造力和安全性,这些结合在一起,为PC交互提供了全新的体验。这两款搭载全新骁龙X Elite处理器的AI PC配备12核Oryon CPU、Adreno GPU和专用Hexagon NPU,提供领先的PC性能,以及迄今为止
豆包大模型公布价格清单,支持国内最高并发标准
近期,火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM限额则高达同规格模型的2.7倍到8倍。图:豆包系列模型“后付费”定价信息官方信息显示:在按照 Tokens 实际使用量计算费用的“后付费”模式下,豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本,模型限流为 1
感到震惊与愤怒,斯嘉丽・约翰逊控诉 OpenAI 擅用其声音
据IT之家此前报道,OpenAI 宣布将暂停 ChatGPT 的“Sky” 语音,起因是用户指出该声音与演员斯嘉丽・约翰逊 (Scarlett Johansson) 的声音十分相似。OpenAI 在一篇博客文章中表示,“Sky”是五个可用语音之一,其来源为某位女演员,但并非刻意模仿斯嘉丽・约翰逊。斯嘉丽・约翰逊曾出演电影《Her》,片中饰演让男主角坠入爱河的虚拟助手系统。CNN 报道称,斯嘉丽・约翰逊昨天晚上发布了一份声明,称 OpenAI 在去年 9 月份联系她,希望能够提供声音,OpenAI 首席执行官阿尔特曼
声称“媲美人类专家”,谷歌 Gemini 1.5 Pro 数学版“提智”:MATH 基准准确率 91.1%
谷歌公司上周发布技术报告,表示 Gemini 1.5 Pro 模型在经过专门的数学领域训练之后,大幅提高了数学成绩,并成功解决了国际数学奥林匹克竞赛的部分问题。谷歌针对数学场景有针对性地训练 Gemini 1.5 Pro 模型,并通过 MATH 基准、美国数学邀请考试( AIME) 和谷歌内部的 HiddenMath 基准进行测试。根据谷歌的数据,数学型 Gemini 1.5 Pro 在数学基准测试中的表现“与人类专家的表现相当”,与标准的非数学型 Gemini 1.5 Pro 相比,数学型 Gemini 1.5
速度更快!新版 SD WebUI Forge 保姆级安装教程
不知道平时经常使用 SD WebUI 的小伙伴发现没有,随着安装插件和模型越来越多,WebUI 时不时会出现卡顿或爆显存的情况,尤其在低显存的硬件上更加明显,只能不停的重启来解决。
估计是 WebUI 的作者张吕敏博士自己也发现了这个问题,于是升级版的 SD WebUI Forge 它来了!操作界面虽然和原来的一模一样,但运行效率和图像生成速度都有了不错的提升,下面快跟着我来看看吧~
一、Forge 基础介绍
首先关于为什么取 Forge 这个名字:单词 Forge 有「锻造」的意思,根据作者解释,该词的灵感是来源
AI 网页设计神器 Wegic!5分钟帮你创建一个专属网站!
大家好,这里是和你一起探索 AI 的花生~
对大部分人来说,建一个网站肯定是一件比较复杂的事情,需要找具有专业技能的设计师或者公司来处理。今天我们一起来认识一位 “AI 网页设计师” Wegic,你只需要告诉它你的想法,它就能在几分钟之内帮你生成一个完整精美的网站,让原本专业的事情对普通人来说也变得无比简单。
相关推荐:Wegic
网站直达:
Wegic 是一个支持仅通过自然对话交互就完成网站创建和管理的在线工具,新用户有 120 个积分,可用于 3 次网站生成或者 12 次内容修改。在官网主页点击「create
OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增,移动端营收暴涨
OpenAI 近期发布了旗下最新的人工智能模型 GPT-4o,该模型使得该公司移动端应用 ChatGPT 的营收迎来了史无前例的增长。尽管 GPT-4o 在官网上可免费使用,但对于移动端的 ChatGPT 应用来说却并非如此。想要在手机上体验这一最新技术的用户,需要升级到 OpenAI 的付费订阅服务“ChatGPT Plus”,月费 19.99 美元(IT之家备注:当前约 145 元人民币)。图源 Pexels这一策略性决策刺激了移动端用户对订阅服务的需求,并由此创造了 OpenAI 有史以来最高的移动端收入增长
摩根大通:新员工都将接受人工智能培训
美国最大金融服务机构之一摩根大通(JPMorgan Chase & Co.)将让所有新入职的员工接受人工智能 (AI) 培训,以应对这项被首席执行官杰米・戴蒙 (Jamie Dimon) 类比为印刷术和蒸汽机的颠覆性技术。图源 Pexels“今年入职的所有员工都将接受‘提示词工程’培训,为迎接未来的 AI 时代做好准备,”摩根大通资产管理部门负责人玛丽・埃尔多斯 (Mary Erdoes) 在周一举行投资者大会上表示。埃尔多斯女士指出,人工智能在她的部门正发挥着节省时间和提高收益两大方面的作用。通过人工智能,银行家
谷歌搜索“AI 摘要”功能闹笑话:推荐用户喝尿以快速排出肾结石
感谢谷歌一直致力于利用人工智能革新搜索引擎领域,然而新功能在正式发布之前却闹出了笑话:它建议用户饮用大量‘浅色’尿液作为快速排出肾结石的方法。图源 Pexels这个名为“搜索生成式体验”(Search Generative Experience,SGE)的人工智能功能在测试阶段就给出过该建议,如今改头换面为“AI 摘要”(AI Overviews)的它已在美国率先上线,并计划陆续登陆其他地区,但在上线前一周仍出现过上述建议。IT之家注意到,与以往的搜索结果摘要不同,“AI 摘要”不会仅仅展示网站的链接,而是尝试用人
“人工智能教父”Geoffrey Hinton 忧心 AI 取代劳动力,建议英国政府实施全民基本收入制度
人工智能领域先驱 Geoffrey Hinton 因其在神经网络方面的开创性工作而被誉为“人工智能教父”,近日他对人工智能的发展表达了担忧。他表示,人工智能可能会取代大量传统工作,并建议英国政府实施全民基本收入制度来应对这一挑战。YouTube 截图据 BBC 报道,Hinton 在采访中坦承,“我非常担心人工智能会取代许多简单的工作。” 为了解决这一问题,他认为全民基本收入不失为一个可行的方案。“我曾受邀到唐宁街与政府官员进行商讨,” Hinton 说道,“当时我建议他们考虑全民基本收入制度。”据IT之家了解,全
网易天音 AI 工具已开放使用:词、曲、编、唱、混等音乐创作辅助
感谢网易天音平台现对网易云音乐的全部用户开放使用权限。网易云音乐 App 同步开启“神奇礼物店”活动,用户参与活动即可生成“AI 音乐”关键词,可在网易天音官网进行 AI 创作时使用。官网还提供乐理知识学习,分为入门篇和进阶篇,包含作曲、作词等内容,针对音乐领域的常见问题也有解答。目前,网易天音属于 Beta 版阶段。IT之家查询网易天音官网获悉,网易天音是网易云音乐旗下一站式 AI 音乐创作工具,具备词、曲、编、唱、混等音乐创作全流程的 AI 创作辅助功能。网易天音在 2022 年 1 月便完成小程序上线,小程序
掌阅与亚马逊云科技达成合作,将探索文生视频等多维阅读交互方式
掌阅科技日前宣布与亚马逊云科技达成合作,将借助亚马逊云科技在北京、宁夏区域的机器学习平台 Amazon SageMaker 及 Stable Diffusion 亚马逊云科技插件解决方案等技术,为用户提供文生图、文生视频在内的多维度阅读交互方式,打造“沉浸式”的阅读体验。掌阅方面表示,借助亚马逊 Amazon SageMaker 获得了快速构建、训练和部署机器学习模型的能力,加速了模型训练效果的验证与优化;依托 Stable Diffusion 亚马逊云科技插件方案,可将现有 SD 模型训练、推理和调优等工作负载从
闷声狂奔一年,字节大模型的进阶之路
2024 年初,字节跳动 CEO 梁汝波在年会中提到,公司层面的半年度技术回顾里,2023 年才出现 GPT 相关讨论。 作为对比,业内做得比较好的大模型创业公司基本在 2018 年到 2021 年之间已经创立。 简而言之,这场由 Open AI 在 2022 年底发布 ChatGPT 3.5 而掀起的“大模型”盛宴,字节没有成为最早的“入场嘉宾”。
声音太像斯嘉丽・约翰逊,OpenAI 停用 ChatGPT 语音选项“Sky”
感谢OpenAI 宣布将暂停供聊天机器人 ChatGPT 语音功能使用的“Sky” 语音,起因是用户指出该声音与演员斯嘉丽・约翰逊 (Scarlett Johansson) 的声音十分相似。IT之家注意到,OpenAI 在一篇博客文章中表示,“Sky”只是五个可用语音之一,其来源为某位女演员,但并非刻意模仿斯嘉丽・约翰逊。斯嘉丽・约翰逊曾出演电影《Her》,片中饰演让男主角坠入爱河的虚拟助手系统。5 月 14 日 OpenAI 发布了新的 GPT-4o 模型,GPT-4o 可以理解用户的语音提问并用语音进行回答。
高德地图:拟与浙江衢州共同打造首个时空智能城市,将逐步开放 AI 能力
感谢IT之家从高德官方获悉,在今日的 AI Day 技术开放日活动期间,高德地图旗下高德云图宣布将逐步开放云睿时空融合大模型和云境 AI 三维重建平台,打造时空智能体应用生态,助力智慧城市向时空智能城市进化。高德地图董事长刘振飞表示,高德将助力构筑 AI 时代的时空智能新基建。活动中,高德宣布已经与浙江省衢州市达成合作意向,双方拟共同打造首个时空智能城市。据介绍,上一代智慧城市建设是基于二维的城市还原,通过城市多元数据融合,解决城市管理中碰到的诸如“数据烟囱”(不能与其他相关信息系统进行互操作或者协调工作的信息系统
AI在用 | 一款AI视频换脸神器,让安吉丽娜·朱莉秒变「女版」马斯克
机器之能报道编辑:山茶花 以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。(一大早的选题会上)A:今天的选题是 Faceswap,一款 AI 换脸工具。B:有啥创新性使用场景?A:诈骗…… 呃,电影制作……不得不说,AI 进化得越来越颠了!Faceswap 官网放出了不少演示,个顶个地以假乱真。它不
集聚场景驱动力,激发AI生产力——WAIC 2024“人工智能+”应用场景持续广泛征集
今年的政府工作报告提出,大力推进现代化产业体系建设,加快发展新质生产力。同时要深化大数据、人工智能等研发应用,开展“人工智能 ”行动。近年来,上海市委、市政府不断创新政策举措,探索应用场景,深入推进城市转型、产业升级,为新一代人工智能发展开辟了广阔天地。世界人工智能大会(WAIC)作为行业标杆性盛会,每年都集聚了全球人工智能领域最具影响力的科学家、企业家、政界人士、高校组织、投资人及初创团队,已然成为全球人工智能领域学术与行业交流、展览展示、合作洽谈的重要平台和窗口。2024世界人工智能大会将于7月初在上海举办,大