资讯列表
未来集成到AI中?以78%准确率识别声音,「生物计算机」将实验室培养的脑组织与电子硬件融合
大脑类器官的一部分,其中干细胞(粉色)正在分化为神经元(紫色)。(来源:Steve Gschmeissner/Science Photo Library)编辑 | X类脑计算硬件旨在模拟大脑的结构和工作原理,可用于解决当前 AI 技术的局限性。然而,以大脑为灵感的硅芯片在完全模拟大脑功能方面的能力仍然有限,因为大多数例子都是基于数字电子原理构建的。近日,来自美国印第安纳大学伯明顿分校(Indiana University Bloomington)的研究团队构建了一种「混合生物计算机」,将实验室培养的人脑组织与传统电
ChatGPT构建离不开PyTorch,LeCun言论引热议,模型厂商不开放权重原来为此
其实,开源、闭源各有其道理,关键看如何抉择。这两天,有关开源的话题又火了起来。有人表示,「没有开源,AI 将一无所有,继续保持 AI 开放。」这个观点得到了很多人的赞同,其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。想象一下,如果工业界的 AI 研究实验室仍然封闭、没有开源代码,并为所有内容申请和执行专利,那么今天的 AI 行业将会变成什么样子?想象一个没有 PyTorch 的世界,并且 Transformer、ResNet、Mask-RCNN、FPN、SAM、DINO、seq2seq、wav2v
NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²
美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。该论文从理论角度分析和论证视频编辑过程中出现的不一致的问题,主要由引入的时序信息学习模块使特征空间出现协变量偏移造成,并针对性地设计了新的网络模块进行解决以生成高质量的编辑结果。目前,该论文已被机器学习顶会之一 NeurIPS 2023 接收。背景作为当前炙手可热的前沿技术之一,生成式 AI 被广泛应用于各类视觉合成任务,尤其是在图像生成和编辑领域获得了令人赞叹的生成
超声芯片革新脑机接口:向无创植入更进一步
Forest Neurotech 和 Butterfly Network 合作构建了一种能够实现「亚毫米精度」操作的脑机接口,相比于传统的电信号,它将使用超声波来刺激和记录大脑活动。2023 年,脑机接口(BCI)技术仍然经历了快速发展的一年。目前已经有一些成果能够解码脑信号来控制外部设备,同时也有成果能够通过外部设备改变脑信号。一些 BCI 开发公司,比如 Neuralink、Paradromics 和 Synchron,都迎来了进入人体临床试验阶段的希望。今年 5 月,Neuralink 获得了美国食品和药物监
论文遭首届ICLR拒稿、代码被过度优化,word2vec作者Tomas Mikolov分享背后的故事
除了表达自己获得 NeurIPS 2023 时间检验奖的感想之外,Tomas Mikolo 还对 NLP 和 ChatGPT 的现状给出了自己的一些思考。几天前,NeurIPS 2023 公布了获奖论文,其中时间检验奖颁给了十年前的 NeurIPS 论文「Distributed Representations of Words and Phrases and their Compositionality」。这项工作引入了开创性的词嵌入技术 word2vec,展示了从大量非结构化文本中学习的能力,推动了自然语言处理新
数智上海2023峰会成功举办,百余位大咖齐聚,共论智能创新赋能产业数字化转型
以“应变求机 以数谋新”为主题的 2023 上海城市数字化转型体验周于 12 月 16 日在上海财经大学国家大学科技园开幕。市政府副秘书长庄木弟为上海城市数字化转型工作先进集体、先进个人代表颁奖。市经济信息化工作党委书记程鹏为数智上海智库协作超级节点第二批共建单位授牌。市经济信息化委副主任张宏韬、杨浦区区长周海鹰致辞。数智上海 2023 峰会同期举行,中国工程院院士邬江兴,中国工程院院士、德国工程科学院院士、瑞典皇家工程科学院院士吴志强作主题分享。大会以 “智能创新赋能产业数字化转型” 为主题,带来 1 场主论坛、
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理
最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。OpenAI CEO Sam Altman 随后否认了该截图的真实性,GPT4.5 的具体能力依然是一个谜。不过,在众多研究中,确实已经有大模型实现了多个模态同时处理,甚至连视频、3D 模型也囊括了进来。给你一首曲子的音频和一件乐器的 3D 模型,然后问你这件乐器能
源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini
软件开发人员对代码生成 AI 已经不陌生,它们已经成为提高生产力的利器。本文中,伊利诺伊大学香槟分校(UIUC)张令明老师团队带来了代码生成 AI 领域的又一力作 ——Magicoder,在短短一周之内狂揽 1200 多颗 GitHub Star,登上 GitHub Trending 日榜,并获推特大佬 AK(@_akhaliq)发推力荐。Hugging Face 技术负责人 Philipp Schmid 表示:“代码自动补全工具,如 GitHub Copilot,已被超过一百万开发者使用,帮助他们的编码速度提高了
阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效
文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生成效果非常连贯。文本提示:A kitten in flowers, Chinese painting.(一只小猫在花丛中,中国画。)文本提示:A yellow robot.(一个黄色的机器人)文本提示:A photo of an ancient shipwreck nestled on the ocean floor. Marine plants have claimed the wood
韩方认定,LK-99室温超导无法证明,国内团队:延伸材料有神奇特性
没有证据证实 LK-99 为常温超导体,但一个国内团队表示 LK-99 的延伸材料确实具备神奇性质。轰轰烈烈的韩国「室温超导」事件,最近似乎划上了句号。韩国超传导低温学会验证委员会近日表示,此前由韩国研究团队制造的疑似室温超导体 LK-99 没有显示出超导的任何关键特征。LK-99 源自韩国一个研究团队在今年 7 月份发布的两篇论文。在论文中,作者宣称,他们合成了一种常压下的室温超导材料,其超导临界温度超过了水的沸点,最高达到 127 摄氏度。这种材料被他们命名为 LK-99,是一种铜掺杂的铅磷灰石(合成之后的样品
大模型的下一站,AI 视频生成的技术突破与未来
站在年末的时间点上,我们明显可以感知到,2023 年是当之无愧的大模型元年,从文本大模型 ChatGPT,到图片生成模型 Stable Diffusion 和 Midjourney,技术的发展日新月异,大模型正在改变着行业格局。与此同时,文本生成和图片生成似乎已经不足以满足算法科学家和工程师们的野心。近几个月来,视频生成和视频编辑领域的新星频繁登上各大媒体头条。Runway 发布了 Gen-2,可以快速生成高质量的短视频;Stability AI 开源了文生视频的扩散模型 Stable Video Diffusio
陶哲轩青睐的证明助手Lean,用上了大模型
现在,数学辅助证明工具都用上了大模型。「我预计,如果使用得当,到 2026 年,AI 将成为数学研究和许多其他领域值得信赖的合著者。」数学家陶哲轩在之前的一篇博客中说道。陶哲轩这样说了,也这样做了。他最近一直在用 GPT-4、Copilot、Lean 等工具进行数学研究,并且还在 AI 的帮助下发现了自己论文中的一处隐藏 bug。不仅如此,前几天,陶哲轩表示:对多项式 Freiman-Ruzsa 猜想(PFR)的证明进行形式化的 Lean4 项目成功完成,并且耗时仅三周时间。Lean 编译器也报告该猜想符合标准公理
下一代自动驾驶系统,少不了大模型,系统调研来了
本文介绍了将多模态大语言模型(MLLMs)整合到下一代自动驾驶系统中的模式。随着大语言模型 (LLM) 和视觉基础模型 (VFM) 的出现,受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里,LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力,但其在驾驶系统中的关键挑战、机遇和未来研究方向仍然缺乏文章对其详细阐明。在本文中,腾讯地图、普渡大学、UIUC、弗吉尼亚大学的研究人员对这个领域进行了系统调研。该研究首先介绍了多模态大型语言模型 (MLLM) 的背景
“数智说”生成式人工智能创新应用赋能千行百业论坛成功举办
锚定打造人工智能“上海高地”,上海正加速建设具有全球竞争力的大模型产业生态。12 月 16 日,数智上海 2023 峰会“数智说”生成式人工智能创新应用赋能千行百业论坛成功举办。大模型领域专家学者、头部企业代表汇聚一堂,分享生成式 AI 最新技术进展及在金融、工业、医疗、教育等领域前沿赋能实践,共论大模型最新发展趋势。本论坛由上海市城市数字化转型工作领导小组办公室、上海市经济和信息化委员会、上海市杨浦区人民政府指导,上海市杨浦区科学技术委员会、上海市城市数字化转型应用促进中心主办,中国联合网络通信有限公司上海市分公
AI炼金术革新化学:MIT学者使用生成式AI,六秒生成新化学反应
编辑 | 凯霞从「等价交换」的远古炼金术开始,化学一直是一门了解和控制物质间相互作用的学科。人们经过不断解锁和利用新的化学反应,研发出了一系列新材料。在为人们生活提供便利的同时也提升了能量利用效率,促进可持续发展。一个基元化学反应由反应物,过渡态(TS),生成物三者构成。过渡态是化学中至关重要的 3D 结构,被广泛用于理解化学反应机制、估算反应能垒以及探索庞大的反应网络。然而,由于其在反应过程中存在的时间极短(飞秒量级),实验中几乎不可能分离和表征过渡态。常规情况下,人们使用量子化学的计算方法,通过反复求解薛定谔方
盘古大模型AI生态加速营圆满结营,携手创业者繁荣AI创新生态
12月15日,华为云加速器——盘古大模型AI生态加速营(以下简称“加速营”)圆满结营,并举办了面向创投圈层的结营开放日活动。在场的500多位华为云加速器校友、创业者、投资人和媒体朋友,共同见证了33家创业公司创始人的结业典礼,并观摩了创业公司与盘古大模型共创的创新应用场景。加速营于2023年9月21日开营,12月15日结营。33家AI创业公司,涵盖了AI技术和应用的众多场景,从模型层、数据处理和中间层、到应用层,展现了他们在不同领域和行业中的创新性和前沿性。加速营期间,基于盘古大模型和昇腾算力,创业公司与华为云共同
AIGC大厂实战!京东到家如何快速完成营销海报设计?
现阶段,AIGC在设计行业的影响速度非常快,大环境背景下,我们在营销设计上也不断使用AI助力。AIGC设计流程中,想精准落地视觉,需要结合传统设计手法相互配合。 那么对于设计师来说,想要提高工作效率,掌握AIGC能力也是必然的。
更多AIGC实战案例:
操作简单效果好!如何使用Stable Diffusion做品牌视觉延展?
设计师在从事品牌视觉相关设计的过程中,往往离不开使用品牌视觉符号进行主题化或风格化设计,下面就为大家分享如何使用 Stable Diffusion 来辅助进行品牌视觉 Logo 延展设计。
更多SD教程:一、环境搭建
在进行设计之前我们需要先下载 Controlnet QR Code Monster 模型,该模型可以很好的帮助我们对品牌视觉符号 logo 图形进行比较准确的控制。
模型下载传送门: control_v1p_sd15_qrcode_monster.safetensors、control_v1p_sd