应用
魔法填充+无限扩图,Ideogram推出AI画板工具Canvas
今天是个好日子,至少对 AI 来说是如此。 过去 24 小时内发布或更新的 AI 服务包括但不限于 Stable Diffusion 3.5 最强模型全家桶、能操作用户电脑的 Claude 3.5 Sonnet、Genmo 开源的可商用的 Mochi 1 DiT、Runway 推出的一款生成式角色表演工具…… 以及我们这里要介绍 Ideogram Canvas,一款基于 AI 的无限创意画板服务,可用于组织、生成、编辑和组合图像。 用过的都知道,画板或者说白板应用在激发创意、厘清思维方面大有作用,现在有了 AI 的助力,画板应用的潜力将被进一步激发。
真·赛博菩萨!最大的开源视频模型来了,我们实测:有点东西,但不多
AI好好用报道编辑:杨文目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。 昨晚,AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ,并且大手一挥,直接给开源了 。
智谱与中国三星官宣战略合作:AI 手机与 GLM 大模型相结合
中国三星与智谱华章(简称“智谱”)昨日宣布战略合作,双方称将在 AI 手机领域展开深度共创,共同打造卓越体验的 AI 产品。 三星电子大中华区用户体验战略副总裁许元默表示:“此次深度合作,我们将三星 AI 硬件优势和对标全球体验的应用场景与智谱 GLM 大模型相结合,一起为用户打造更加优质、个性化的 AI 手机和智能服务。 ”智谱 CEO 张鹏表示:“未来,我们将与三星携手,共同从生产力、创造力、娱乐等方面,为用户打造更加优质的全新 AI 体验。
西湖大学发布 “AI 科学家” Nova,效果相比SOTA提升2.5倍
还记得今年夏天让众多科研工作者“瑟瑟发抖”的 AI scientist 吗? 彼时的它,作为一个由谷歌Transformer 论文作者 Llion Jones 和前谷歌研究人员 David Ha 共同创立的全自动科学研究平台,从提出研究设想、检查创新程度,再到设计实验、编写程序、再GPU上执行实验并收集结果,到最后完成论文的撰写,一气呵成,让不少科研工作者早早就有了“事业危机感”。 此外,该项目还获得了New Enterprise Associates、Khosla Ventures、Lux Capital等多家全球知名投资机构以及NVIDIA等产业投资人的投资,进一步推动了其技术突破和市场化落地。
荣耀 MagicOS 9.0 升级支持 30 亿参数端侧大语言模型:功耗下降 80%,内存占用减少 1.6GB
感谢荣耀今日正式发布 MagicOS 9.0,号称是“行业首个搭载智能体的个人化全场景 AI 操作系统”。 在 MagicOS 9.0 中,MagicOS 全新魔法大模型家族迎来升级,支持端云资源灵活调配,不同设备灵活部署,AI在线附各版本如下:500 万参数图像大模型,端侧部署,全系列支持4000 万参数图像大模型,端侧部署,中高端系列30 亿参数大语言模型,端侧部署,中高端系列10 亿参数多模态大模型,端侧部署,中高端系列1500 万参数语音大模型,端侧部署,全系列支持荣耀表示,MagicOS 9.0 升级支持 30 亿参数端侧大语言模型,相比 MagicOS 8.0 的 70 亿参数魔法大模型,加载速度提升 77%、出词速度提升 500%、功耗下降 80%。 此外,新版大模型的内存占用减少 1.6GB,存储占用减少 1.8GB。
超万名文艺界人士联署警告 AI 公司:对生计造成不公正的重大威胁
感谢据《卫报》22 日报道,10500 名创意产业人士联合签署一份声明,警告人工智能公司未经许可使用他们的作品,称这是对艺术家生计的“不公正的重大威胁”。 声明发表之际,创意产业人士与科技公司之间正就版权问题发生一系列法律纠纷。 创作者们认为,未经许可使用他们的知识产权是一种版权侵犯。
全球首次:AI 机器人画作首登苏富比拍卖,预估成交价 12~18 万美元
CBSnews 于 10 月 21 日报道,苏富比拍卖行将于本月举办“数字艺术日”的拍卖活动,其中由类人机器人艺术家 Ai-Da 创造的《AI God》肖像画备受关注。 该肖像画对象是阿兰・图灵(Alain Turing),这位数学家和计算机科学家被认为是现代计算的始祖,图灵还被称为“AI 之父”,是最早对现在所称的“人工智能”提供一些见解的人之一。 这幅肖像画尺寸为 64 x90.5 英寸(约 1.63*2.3 米),由 Ai-Da 机器人今年创作,签名为“A”,预计在苏富比网站上的列表中拍卖价格在 12 万美元到 18 万美元(AI在线备注:当前约 85.6 万元到 128.3 万元人民币)之间,拍卖将于 10 月 31 日开始。
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
科技媒体 The Decoder 昨日(10 月 22 日)发布博文,报道称谷歌 DeepMind 团队携手麻省理工学院(MIT),推出了全新的“Fluid”模型,在规模达到 105 亿参数时候,能取得最佳的文生图效果。 目前在文生图领域,行业内的一个共识是自回归模型(Autoregressive Models)不如扩散模型(Diffusion Models)。 AI在线简要介绍下这两种模型:扩散模型 (Diffusion Models): 这是一种最近非常热门的内容生成技术,它模拟的是信号从噪声中逐渐恢复的过程。
OceanBase 4.3.3发布,致力打造AI时代的一体化数据库底座
AI 时代,需要怎样的数据库? 10月23日,独立数据库厂商OceanBase在2024年度发布会上推出OceanBase 4.3.3GA版本,升级向量检索与索引功能,实现SQL AI一体化。 该版本深度融合AI与数据库处理能力,支持多模态数据的融合查询,帮助企业简化AI技术栈,提升AI应用构建效率。
微软和 OpenAI 将向媒体提供 1000 万美元资助,推动其使用 AI 工具
微软和 OpenAI 宣布,他们将向部分媒体机构提供高达 1000 万美元(AI在线备注:当前约 7129.5 万元人民币)的资助,以鼓励他们尝试在新闻编辑室中使用 AI 工具。这笔资助包括 250 万美元现金以及价值 250 万美元的微软和 OpenAI 软件和企业信用额度。图源 Pixabay这一消息发布之际,两家公司仍面临着一系列版权诉讼,包括来自《纽约时报》、The Intercept、Raw Story、AlterNet、《调查报告中心》和 Alden Global Capital 的诉讼。
Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强
DeepMind闷声干大事,悄悄训练了一个大小只有270M的Transformer模型,居然不需要搜索,就能实现大师级的下棋水平。 这几天的推特因为这篇2月份发布的论文吵得不可开交,DeepMind团队也赶紧放出了更新后的论文版本,开源了有关数据集和代码,对网上的争议做了回应。 最开始,有位网友分享了DeepMind的这项研究,并提出“Transformer也能用于逻辑任务”的观点,没想到却激起了一场关于Transformer能不能推理的争论。
对话《人类简史》作者尤瓦尔:我们需要防止人工智能失控,确保其符合人类价值观
“2024 ESG 全球领导者大会”于 10 月 16 日-18 日在上海举行。新浪财经欧洲站站长郝倩与知名历史学家、哲学家、《人类简史》、《智人之上》作者尤瓦尔・赫拉利展开对话。尤瓦尔认为,人工智能(AI)的崛起是人类所面临的一大挑战。
黄仁勋:英伟达已将 AI 应用于芯片设计、软件编写和供应链管理等领域
感谢据《华尔街日报》今日报道,英伟达 CEO 黄仁勋对数千名企业技术领导者表示,企业必须转型为依靠人工智能驱动的组织,以迎接他所称的“新工业革命”。黄仁勋说,英伟达已经将这种理念付诸实践,积极地将 AI 应用于芯片设计、软件编写和供应链管理等领域。黄仁勋表示,从长远来看,英伟达正在打造他所述的“AI 大脑”。
一夜之间,大模型像人一样操控电脑了!Claude 3.5重磅升级,抢先OpenAI
几个小时前,Claude 3.5 模型迎来了一波大更新。Anthropic 推出了升级版的 Claude 3.5 Sonnet 以及一款新模型 Claude 3.5 Haiku。其中,升级版 Claude 3.5 Sonnet 的各项能力全面胜过之前版本,其中代码能力提升显著。
JetBrains 为开发者打造最强 AI 助手 Mellum:为编程而生,延迟低、补全快、准确度高
感谢JetBrains 公司昨日(10 月 22 日)发布博文,专门设计推出了全新的大语言模型 Mellum,为软件开发者提供更快速、更智能和更具上下文意识的代码补全。官方表示 Mellum 相比较其它大语言模型,最大的亮点就是专门为开发者编程而设计的,具备延迟低、性能强、功能全面等优点,可以在最短时间内为开发者提供相关建议。Mellum 已支持 Java、Kotlin、Python、Go 和 PHP 等流行编程语言,用户可通过加入早期访问计划获取更多语言支持。
开源文生图 AI 重磅选手上新:Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”
Stability AI 公司昨日(10 月 22 日)发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。Stable Diffusion 3.5 共有 Medium(10 月 29 日发布)、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求,AI在线附上相关介绍如下:Stable Diffusion 3.5 Large:共有 80 亿个参数,具有卓越的质量和快速响应,是 Stable Diffusion 家族中最强大的模型,非常适合 100 万像素分辨率的专业应用场景。Stable Diffusion 3.5 Large Turbo:是 Large 的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。
消息称微软亚洲研究院前首席研究经理谭旭加入月之暗面,研发类 GPT-4o 端到端语音模型
感谢据“晚点 Auto”昨晚报道,微软亚洲研究院前首席研究经理谭旭于 8 月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。报道称,月之暗面的整个多模态研究早在去年 10 月就已开始。接近该公司人士称,目前正有 10 人左右的团队在研发视频模型,为确保产品更具差异性,对外发布计划仍在推迟。
Anthropic 推出升级版 Claude 3.5 Sonnet 模型,可操控用户电脑
感谢当地时间 10 月 22 日,Anthropic 推出了升级版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升级版 Claude 3.5 Sonnet 不仅编程能力更强,还带来全新功能 computer use(计算机使用),支持像人类一样操作计算机,可以遵循用户的命令在计算机屏幕上移动光标,点击相关位置,并通过虚拟键盘输入信息,模拟人们与自己计算机的交互方式。AI在线注意到,升级版 Claude 3.5 Sonnet 现已可以使用,computer use 测试版也已开放使用。进化后的 Claude 3.5 Sonnet 在各个方面得到了全面显著的提升,尤其是业界领先的编码能力。