AI在线 AI在线

资讯列表

视频、图像、文本,只需基于下一个Token预测:智源Emu3发布,验证多模态模型新范式

OpenAI 前首席科学家、联合创始人 Ilya Sutskever 曾在多个场合表达观点:只要能够非常好的预测下一个 token,就能帮助人类达到通用人工智能(AGI)。虽然,下一 token 预测已在大语言模型领域实现了 ChatGPT 等突破,但是在多模态模型中的适用性仍不明确,多模态任务仍然由扩散模型(如 Stable Diffusion)和组合方法(如结合 CLIP 视觉编码器和 LLM)所主导。2024 年 10 月 21 日,智源研究院正式发布原生多模态世界模型 Emu3。
10/21/2024 1:11:00 PM
机器之心

苹果内部员工自揭其短:生成式AI研发竟已落后两年多

前两天,苹果更新了 iPad mini 产品线,而这款最小型的 iPad 已经三年没有更新了。很显然,这次更新也是苹果为了让全产品线都具备其最新的 AI 能力。                                   图源:苹果官网不过,苹果的 AI 能力究竟如何呢?
10/21/2024 1:03:00 PM
机器之心

突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/21/2024 1:02:00 PM
机器之心

NeurIPS 2024 | 标签噪声下图神经网络有了首个综合基准库,还开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/21/2024 12:57:00 PM
机器之心

假装被马斯克裁员的整活鬼才,现在 AI 创业融资 500 万美元

给马斯克“整了个大活”的那个男人,靠 AI 创业获得了 500 万美元(约 3552 万人民币)融资。他是 Daniel Francis,创业公司 Abel,做的是一款辅助警察完成文书工作的应用。你可能不熟悉这个名字,但又似乎见过这张脸,他此前有过这样一段“英雄事迹”——在马斯克收购推特后大裁员的当天,Daniel Francis(当时化名 Johnson)和另一名小哥(化名 Ligma)一起到推特大楼下,冒充被裁的员工整活。
10/21/2024 12:37:44 PM
汪淼

研究发现 AI 工具对学生来说是“双刃剑”,需谨慎使用

瑞典研究人员对人工智能工具的使用与学龄儿童的执行功能之间的关联进行了调查。研究发现,人工智能工具的使用对学龄儿童的学习既有潜在的好处,也有潜在的风险。图源 Pexels该研究重点关注人工智能工具在学校作业中的使用与执行功能(EF)之间的关系。
10/21/2024 11:47:57 AM
远洋

还是原装Transformer好!北大清华团队同时揭示Mamba等推理短板

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/21/2024 11:11:00 AM
机器之心

谷歌计划将 Gemini 并入 Deepmind,下个月开始生效

刚刚,谷歌任命尼克·福克斯(Nick Fox) 接替普拉巴卡尔·拉加万(Prabhakar Raghavan )为搜索和广告主管,同时将 Gemini 团队转移到 DeepMind,整合了 AI 团队。 据彭博社报道,负责监督搜索引擎和广告产品的 Google 最高级别高管 Prabhakar Raghavan 在领导公司的核心赚钱业务四年后即将离职,被下调到首席技术专家的岗位。 接替 Raghavan 的是曾在他手下担任搜索代理的资深 Google 高管 Nick Fox。
10/21/2024 10:32:00 AM
郑佳美

首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2

复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保证了高分辨率视频的质量和流畅性。
10/21/2024 9:42:57 AM
汪淼

国内首个应用临床眼科大模型 “伏羲慧眼”发布,可检测、预测眼部健康状态

AI在线从“河南发布”获悉,10 月 17 日,国内首个应用临床眼科大模型 ——VisionFM(“伏羲慧眼”)在郑州发布。河南省医学科学院院长王宁利介绍,“伏羲慧眼”通俗讲既是一个前沿平台,也是一项人工智能应用。它拥有一个超强“大脑”,汇聚了来自 26 个国家和地区的 56 万个个体的 8 个模态、共计 340 万张眼部图像,是目前全球规模最大的眼科图像数据库。
10/21/2024 9:28:33 AM
清源

中国移动上海产业研究院:金融领域 AI 大模型渗透率过半,系行业最高

据《北京商报》周日报道,在 2024 金融街论坛年会“AI 金融赋能数字金融新篇章”平行论坛上,中国移动上海产业研究院副总经理陈豫蓉介绍,金融领域是大模型渗透率最高的行业,渗透率超过 50%。智慧销售、智能问答和智能风控是现阶段金融行业最热门,也是应用成熟度最高的 AI 大模型应用场景。AI在线从报道获悉,金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,被视为大模型技术应用的最优行业之一。
10/21/2024 8:52:35 AM
清源

2024年10月工具合集!6款不容错过的免费AI神器

大家好我是花生~. 今天我们继续 AI 效率神器的第 12 期,一起来看看吧~. 上期回顾:.
10/21/2024 12:42:33 AM
夏花生

132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了

牛顿没解决的问题,AI给你解决了?AI的推理能力一直是研究的焦点。作为最纯粹、要求最高的推理形式之一,能否解决高级的数学问题,无疑是衡量语言模型推理水平的一把尺。
10/20/2024 4:07:00 PM
机器之心

NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构的高效性能

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/20/2024 3:56:00 PM
机器之心

国仪量子发布全球首个 AI 电子顺磁共振波谱仪,精准度打破世界纪录

据科技日报报道,10 月 19 日,在浙江大学举办的 2024 年全国电子顺磁共振波谱学学术研讨会上,国仪量子技术(合肥)股份有限公司(以下简称国仪量子)正式发布了全球首个 AI 电子顺磁共振波谱仪(以下简称 AI-EPR)。这是顺磁共振波谱学领域的重大突破。据介绍,电子顺磁共振技术(AI在线注:以下简称 EPR)是检测材料中未成对电子结构和动力学的重要方法,广泛应用于化学、物理、生物和医学等领域。
10/20/2024 3:35:55 PM
浩渺

Meta 为 WhatsApp 即时通信软件引入 AI 机器人聊天记忆功能,可提供个人化推荐

Meta 公司正在为旗下 WhatsApp 即时通信软件加入 AI 机器人聊天记忆功能,在这款应用的最新安卓版测试版(AI在线注:版本 2.24.22.9)中,其内置的 Meta AI 能够记住用户过去对话的细节,号称可以为用户提供更加个性化和相关的体验,从而与其他厂商的通信软件进行竞争。据介绍,Meta AI 能够回忆各种个人信息,包括饮食偏好、生日,以及特定的交流风格偏好。此外,该 AI 还可以记住用户过敏信息和个人兴趣,例如用户喜欢的书籍、纪录片和播客等。
10/20/2024 9:41:04 AM
漾仔

OpenAI若造出AGI,就能从微软独立:股权争夺战开打,两边都找好了投行

神秘的合约条款被曝光。OpenAI 和自己最大的金主微软,最近出现了关系破裂的迹象。一边是想要更多钱,想要独立性,另一边是已经在分开下注。
10/19/2024 9:34:00 PM
机器之心

SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

今天,Meta 分享了一系列研究和模型,这些研究和模型支撑 Meta 实现高级机器智能(AMI)目标,同时也致力于开放科学和可复现性。这些工作侧重于 AMI 的构建模块,包括感知、语音和语言、推理、具身智能和对齐。研究工作包括 SAM 2.1、Spirit LM、Layer Skip、自学习评估器等。
10/19/2024 9:32:00 PM
机器之心