资讯列表
AI全链路营销公司「奥创光年」完成1500万美元A+轮融资,美图、凯辉联合领投
今日,AI全链路营销公司「奥创光年」(Mogic Ai)对外宣布,已获得1500万美元A 轮融资。本轮融资由美图公司、凯辉基金联合领投、彬复资本、万物创投跟投,其中凯辉基金为奥创光年A轮领投基金,万物创投曾参与奥创光年天使轮投资,本轮继续追加投资。这是奥创光年于2023年8月首次披露其A轮千万级美元融资后,仅在半年内再度公布的新一轮融资,本轮融资由华兴资本担任独家财务顾问。奥创光年是一家AI Native营销公司,团队现已推出SaGa视频内容生成模型及Mogic Content AI Studio(CAS)全链路营
手把手教程!用AI快速做挂件+动态的微信红包封面!
春节马上就要到了,一年一度的微信红包封面大战又要开始了。微信公众号奖了我一万多个红包封面,所以这次我打算挑战一下做个最复杂的红包封面,也就是挂件 动态,并且借由这个测试下现在 AIGC 的能力边界。
更详细的红包教程 7 款AIGC 工具教程:本次测试用到的工具有:图像生成:WHEE
视频生成:Runway
图像编辑:Photoshop sketch
视频剪辑:剪映
图像压缩:iloveimg官方文件与帮助文档:、封面图生成
1. 目标拆解
带挂件的红包封面→需要 png 格式→需要抠图→好扣的图→扁平风
扁
Runway 王炸更新!5个笔刷让人人都能成为神笔马良
前言
上周 Runway 再次升级 Gen-2「运动笔刷」更名为「多头运动笔刷」(Multi Motion Brush),这次可以说是 AI 视频可控性的王炸进化!5 个笔刷,可以对视频局部调整,人人秒变神笔马良。
目前所有用户都可以免费使用,额度 100 秒,每使用一次消耗 4 秒。
接下来让我们一起来试一试吧。
更多AI视频干货:一、使用体验
目前,Runway 可以在官网上或者下载手机 APP 使用。
1. 登录网址
打开官网:
进入 Runwayml 主页,点击图片上的粉色「Start with imag
全方位盘点!7个常用的数字人 AI 设计神器
数字人 IP 设计是一项复杂而富有挑战性的任务,需要借助各种工具来实现。在这个领域,有许多优秀的工具可供选择,它们可以帮助我们创建出逼真、生动的数字人。本文将介绍一些常用的数字人制作工具,包括 MJ SD、虚幻引擎、Blender/C4D/MAYA、SadTalker、微软 Azure、PIKA 和 runway。这些工具在数字人设计的不同方面都有着独特的优势,我们将逐一探讨它们的功能和特点。通过了解这些工具,你将能够更好地掌握数字人设计的技术,实现你的创意想象。
更多数字人干货:一、形象生成工具
1. MJ SD
让IP替品牌讲好故事!夸克x变形金刚联名设计过程复盘
当下越来越多的品牌加入跨界 IP 营销队伍,可以看到如国潮、潮流服饰、二次元、影视等的联名,其底层逻辑还是品牌在寻找一种流量变现。
对于夸克,我们认为与其说教式的结合或博眼球式的曝光,不如换个角度,找到两者的契合点。把品牌的理念、能量寄托到 IP 上,由场景角色的化身为你讲好品牌故事,可能更容易让人记住。在不久前的期末备考期,夸克跟变形金刚电影的联名中,我们实践了这种思路。
而说到这次跨界营销中的亮点,夸克与变形金刚电影的联名手办作为一种新的营销策略,为品牌带来了更多的曝光和关注度。
更多IP设计干货:一、定位
生
多模态大模型,阿里通义千问能和GPT-4V掰手腕了
通义千问的图像推理能力,最近有了大幅提升。2024 年,大模型领域要卷什么?如果没有思路的话,不妨看看各家大厂都在押注什么方向。最近一段时间,先是 OpenAI 推出 GPT-4V,让大模型拥有了前所未有的图像语义理解能力。谷歌随后跟上,发布的 Gemini 成为了业界第一个原生的多模态大模型,它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。很明显,新的方向就是多模态。继 GPT-4 在语言方向的里程碑式突破之后,业界普遍认为「视觉」是下一个爆发的赛道。毕竟人类的五感之中有 80
Mamba论文为什么没被ICLR接收?AI社区沸腾了
基于 Mamba 的创新正不断涌现,但原论文却被 ICLR 放到了「待定区」。2023 年,Transformer 在 AI 大模型领域的统治地位被撼动了。发起挑战的新架构名叫「Mamba」,它是一种选择性状态空间模型( selective state space model),在语言建模方面可以媲美甚至击败 Transformer。而且,它可以随上下文长度的增加实现线性扩展,其性能在实际数据中可提高到百万 token 长度序列,并实现 5 倍的推理吞吐量提升。在发布之后的一个多月里,Mamba 逐渐展现出自己的影
OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价
今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。不知大家是否还记得,去年年底 GPT-4 开始变「懒」的事实。比如在高峰时段使用 GPT-4 或 ChatGPT API 时,响应会变得非常缓慢且敷衍,有时它会拒绝回答用户提出的问题,甚至还会单方面中断对话。 这种情况对于码农来说,更是深有体会,有人抱怨道「让 ChatGPT 扩展一些代码,它竟然让我自己去写。」原本想借助 ChatGPT 帮助自己编写代码,现在好
大模型推理成本排行榜来了:贾扬清公司效率领跑
风投烧完之后,哪些大模型创业公司会开始盈利?「大模型的 API 是个亏本买卖吗?」随着大语言模型技术的逐渐实用化,越来越多的科技公司提出了大模型 API 供开发者们使用。但前有 OpenAI「每天烧掉 70 万美元」,我们也有理由怀疑以大模型为基础的业务到底能不能持续。本周四,AI 创业公司 Martian 为我们仔细盘算了一下。排行榜链接: LLM Inference Provider Leaderboard 是一个开源的大模型 API 推理产品排行榜。对于每个供应商的 Mixtral-8x7B 和 Llama-
大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述
本文介绍首个大模型时代下的文本水印综述,由清华、港中文、港科广、UIC、北邮联合发布,全面阐述了大模型时代下文本水印技术的算法类别与设计、评估角度与指标、实际应用场景,同时深入探讨了相关研究当前面临的挑战以及未来发展的方向,探索文本水印领域的前沿趋势。论文:A Survey of Text Watermarking in the Era of Large Language Models论文链接::文本水印新纪元文本水印是一种信息隐藏技术,起源可以追溯到上个世纪 90 年代。它通过将机密信息(水印)嵌入文本中,实现了
Controlnet 最新动态!6款超好用的新模型解析(附下载)
大家好我是花生~
之前为大家系统介绍过 Stable Diffusion WebUI 中 Controlnet 插件的安装使用方法,也系统梳理过各个模型的用法。现在 Controlnet 又有了一些新的模型和功能,今天正好为大家梳理一下。相关模型文件都在文末的云盘链接内,有需要的小伙伴记得下载~
Controlnet 相关推荐:一、Animal_openpose
Animal_openpose 是一个专门提取狗、鹿、马、豹等四足动物姿势骨架的模型,也可以用来引导人马等奇幻形象的生成。使用时需要:
① 下载 rtmp
岩芯数智推出非Attention机制大模型,支持离线端侧部署
1月24日,上海岩芯数智人工智能科技有限公司对外推出了一个非Attention机制的通用自然语言大模型——Yan模型。岩芯数智发布会上称,Yan模型使用了全新自研的“Yan架构”代替Transformer架构,相较于Transformer,Yan架构的记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。岩芯数智CEO刘凡平认为,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中小型企业望而却步。其内部架构的复杂性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大
美国家AI研究资源试点项目上线,NASA、英伟达、OpenAI等捐赠关键基础资源
机器之能报道编辑:吴昕为确保美国在 AI 技术领域的领先地位,拜登政府曾在几个月前发布 AI 行政命令。该行政命令指出,将通过国家人工智能研究资源试点( National AI Research Resource,NAIRR )促进美国各地的 AI 研究。今天,美国国家科学基金会( NSF )正式启动这个庞大的试点项目,让更多美国研究人员和学校(而不仅仅是财力雄厚的科技公司或精英大学及其研究人员)获得计算资源。试点项目的官网显示NSF 联合了 10 个联邦机构以及多家私营企业、非盈利组织等机构组成联盟,为有抱负的
小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral
近日,小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for automatic speech recognition》被 ICLR 2024 接收为 Oral (Top 1.2%)。论文链接:: Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提
顺网科技公布新战略,推出算力及AI两大业务板块
近日,顺网科技(300113.SZ)对外公布新战略——“立足算力,聚焦AI”,并揭晓了全新的品牌标识。围绕该战略,顺网科技在算力及AI两大业务板块推出了系列创新产品及业务,涵盖顺网算力塔、顺网算力市场两大新产品以及全新的顺网智算中心业务;同时,灵悉智能体引擎及基于该引擎开发的AI陪伴应用“唠唠”也得到了全面展示。顺网科技将在成熟的电竞科技及ChinaJoy业务的支撑下,在算力与AI的黄金赛道重点发力。算力方面,顺网的算力服务路径将从垂直型向多场景转变。顺网科技聚焦垂直行业算力服务的“顺网雲”业务正式升级为“顺网算力
腾讯发布2024数字科技前沿应用趋势,涉及多模态大模型、具身智能、Agent等
1月24日,腾讯发布《2024数字科技前沿应用趋势》报告,预测了数字科技未来发展趋势和应用前景。“过去一年,我们见证了数字科技的加速度。眺望未来2-3年的科技趋势,我们正驶向一个由连接衍生交互、由计算催生智能的时代。”腾讯集团副总裁、腾讯研究院院长司晓说。《2024数字科技前沿应用趋势》报告中提出:高性能计算、量子计算、云计算和边缘计算这“四大计算”融汇贯通,正催生全新的计算范式;通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台, AI治理将引领我们踏上更智慧、更安全的未来。此外,
Hinton、LeCun、Bengio三巨头,马维英、陈海波等华人入选,2023 ACM Fellow公布
本届 ACM Fellow 包揽了万维网发明者、深度学习三巨头等重磅名人学者。今天,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届 Fellow 名单。ACM 创立于 1947 年,是全世界计算机领域影响力最大的专业学术组织之一。ACM Fellow 是由该组织授予资深会员的荣誉,目的为表彰会员中对于计算机相关领域贡献前 1% 的学者,其审查过程十分严格,每年遴选一次,研究员由同行提名,提名由委员会审查。本年度新入选科学家中共有 68 人,他们的贡献涉
「think step by step」还不够,让模型「think more steps」更有用
本文对思维链的推理步长进行了控制变量实验,发现推理步长和答案的准确性是线性相关的,这种影响机制甚至超越了问题本身所产生的差异。如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链(CoT)提示技术,该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理,在各种挑战中表现出了优秀的性能,其中包括跨域、长泛化和跨语言的任务。CoT 及其富有逻辑的、循序渐进的推理方法,在复杂的问题解决场景中提供了至关重要的可