资讯列表
329篇图像、视频生成论文,今年CVPR最火的研究主题是这些
图像与视频合成、3D 视觉、人体行为识别、视觉与语言推理等研究方向论文最多,属于最热门的方向,体现当前学界对视觉生成、三维感知、人机交互等方向的高度重视。另外,多模态学习、以人为本的设计和自适应机器人可能构成人形机器人的未来。一年一度的计算机视觉和模式识别会议(CVPR)一直是 CV 界前沿研究的灯塔。CVPR 2024 录用结果显示,今年共有 2719 篇论文被接收,录用率 23.6%。那么大模型时代,今年的研究主题有哪些变化?最近,乔治亚理工学院计算机学院(College of Computing, Georg
支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]人类跳舞视频生成是一项引人注目且具有挑战性的可控视频合成任务,旨在根据输入的参考图像和目标姿势序列生成高质量逼真的连续视频。随着视频生成技术的快速发展,特别是生成模型的迭代演化,跳舞视频生
轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]黄志恒拥有爱丁堡大学博士和加州大学伯克利博士后研究经历。志恒曾在微软、百度、Facebook、腾讯和亚马逊等 IT 公司工作。志恒在亚马逊 AWS 担任首席科学家领导了 Amazon Ke
免费匿名使用 GPT 等热门大模型,DuckDuckGo AI Chat 聊天机器人发布
感谢IT之家网友 Coje_He 的线索投递!IT之家 6 月 7 日,专注于保护用户隐私的搜索引擎 DuckDuckGo,周四官宣向用户免费开放 DuckDuckGo AI Chat,这是一个可以选择匿名访问 OpenAI GPT 3.5 Turbo、Anthropic's Claude 3 Haiku、Meta Llama 3 、Mixtral 8x7B 的生成式 AI 聊天机器人。官方也宣称计划在未来增加可访问聊天机器人模型的数量。DuckDuckGo AI Chat 本质上充当用户与生成式 AI 聊天机器人
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕
6月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。 大会汇聚政、产、学、研各方力量,围绕2024年RSA大会中热点观察、创新技术所引发的安全新思考、新理念展开深入探讨。 大咖云集——共探AI赋能产业发展之策公安部第一研究所所领导、中国计算机学会计算机安全专业委员会常务副主任于锐在致辞中表示,作为全球信息安全领域最具影响力、规模最大、水平最高的产业峰会之一,RSA大会已成为当前快速了解全球网络安全发展趋势重要风向标。
准确率可达 70%,科学家利用 AI 解读狗的叫声
研究人员正在尝试使用 AI 来解读狗的叫声是在玩耍还是在生气。与此同时,研究人员还尝试使用 AI 识别狗的年龄、性别和品种。密歇根大学的研究人员与位于普埃布拉的墨西哥国家天体物理、光学和电子研究所(INAOE)合作开展了这一研究,发现最初用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。图源 Pixabay密歇根大学人工智能实验室负责人 Rada Mihalcea 表示,人工智能在理解语音的微妙之处方面有了显著进步,可以区分音调、音调和口音的细微差别,可凭借这些研究基础来理解狗吠。开发这种分析动物发声
腾讯联合中山大学、港科大推出图生视频模型“Follow-Your-Pose-v2”
腾讯混元团队联合中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,相关成果已经发表在 arxiv 上(IT之家附 DOI:10.48550/arXiv.2406.03035)。据介绍,“Follow-Your-Pose-v2”只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达 10 秒。与此前推出的模型相比,“Follow-Your-Pose-v2”可以在推理耗时更少的情况下,支持多人视频动作生成。此外,该模型具备较强的泛化能力,
全球 AI 领域“独角兽”企业达 37 家:过去一年新增 17 家,中国新增 5 家
据日经新闻、调查公司 CB Insights 今日消息,截至今年 4 月底,生成式 AI 领域的“独角兽”企业达到 37 家。与去年 4 月底的 20 家相比,AI“独角兽”数量过去一年内几乎翻了一番,瞄准新一代潜力技术的动向正推高企业估值。IT之家注:“独角兽”系估值超过 10 亿美元的未上市企业。截至 2023 年四月底,美国企业仍占 AI 独角兽企业 9 成的份额,而在最近一年内新增的 17 家企业里面,有 10 家将主要基地设在了美国以外的地方。中国则在过去一年内新增了 5 家独角兽企业,包含月之暗面、Mi
华为与中山大学眼科中心发布 ChatZOC 眼科大模型,服务效率提升 75%
IT之家从中山眼科中心官方订阅号获悉,6 月 6 日(第 29 个全国爱眼日)中山大学中山眼科中心与华为技术有限公司合作构建的 ChatZOC 眼科大模型正式发布。据介绍,中山大学中山眼科中心是我国规模最大的公立眼科医院,是国家卫生健康委属委管唯一的眼科专科医院。▲ 中山眼科中心珠江新城院区2023 年 3 月,中山大学中山眼科中心率先发起 ChatZOC 眼科大模型的国产化研发,同年 12 月,与华为启动联合研发。ChatZOC 眼科大模型,以眼病诊疗知识库为基础,链接中山眼科中心大数据平台,结合最新眼科指南和文
2024世界人工智能大会青年优秀论文TOP20发布
2024年3月,《关于推荐“2024世界人工智能大会青年优秀论文奖”参评论文的通知》发布,面向全球高校、科研院所、企业开展人工智能领域青年优秀论文征集活动。至征稿截止,共收到海内外参评论文159篇,包括国际相关知名高校、科研机构、企业。经过初评、复评,现入围2024青年优秀论文TOP20闪亮发布。(按论文领域及姓名字母为序)2024世界人工智能大会青年优秀论文奖将于7月世界人工智能大会上揭晓,敬请期待!
2024世界人工智能大会SAIL奖TOP30榜单发布
作为世界人工智能大会的最高奖项,SAIL奖(Super AI Leader,卓越人工智能引领者)坚持“追求卓越、引领未来”的理念,评选和运营秉持“高端化、国际化、专业化、市场化、智能化”原则,从全球范围发掘在人工智能领域中具有高度认可和美誉、并具有提升人类福祉意义的项目。推荐参评项目经过初评、复评,现入围2024 SAIL奖TOP30榜单项目闪亮发布。SAIL诠释AI,AI改变未来。SAIL奖对人工智能项目寄予了厚望。“S”即“Superior”,代表了“超越”,表明了奖项在行业内卓越引领的地位;“A”即“Appl
英特尔放大招:新制程、能效核一起上,144核的至强6,性能成倍提升
今日,英特尔推出英特尔® 至强® 6能效核处理器,每个 CPU 拥有多达 144 个内核,机架密度提高达3倍1,以高性能、高密度、高能效和低TCO,满足多样的云级工作负载,是数据中心高效能之选。随着企业业务云化和大语言模型等人工智能应用的爆发,社会对算力的需求正飞速增长,对数据中心提出了前所未有的要求,包括更强的计算力、更大的存储容量和更高的网络带宽等。同时,算力规模的增大也给数据中心带来越来越高的能源等成本支出。在 “双碳” 目标驱动下,数据中心亟需通过持续变革实现算力提升和能耗降低的双重目标,同时保持低碳运营。
国产文生视频大模型 Vidu 将迎更新:支持生成 32 秒内容、音视频合成
感谢据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。主要更新内容如下:支持一键生成 32s 视频支持音视频合成,“视频有声音了”(Text-2-Audio)支持 4D 生成,可以从单一视频生成时空一致的 4D 内容IT之家附部分视频预览: 据介绍,Vidu 是自 Sora 发布之后,全球率先取得重大突破的视频大模型,并且仍在加速迭代提升中。据IT之家此前报道,Vidu 模型融合 Diffusion
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想
大模型也可解释了?大模型都在想什么?OpenAI 找到了一种办法,能给 GPT-4 做「扫描」,告诉你 AI 的思路,而且还把这种方法开源了。大语言模型(LLM)是当前 AI 领域最热门的探索方向,吸引了大量的关注和研究投入。它们强大的语言理解能力和生成能力在各种应用场景中都表现出巨大潜力。虽然我们见证了大模型迭代后性能上的显著提升,但我们目前对模型中的神经活动仍然只是一知半解。本周四,OpenAI 分享了一种查找大量「特征」的全新方法 —— 或许这会成为可解释的一种可用方向。OpenAI 表示,新方法比此前的一些
阿里Qwen2正式开源,性能全方位包围Llama-3
Qwen 系列会是众多大学实验室新的默认基础模型吗?斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。HuggingFace 平台和社区负责人 Omar Sanseviero 曾表示,AI 社区一直在「忽视」中国机器学习生态系统的工作,他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情,如 Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、Inter
ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]徐俊东,本文第一作者。本科毕业于伦敦大学学院(UCL),硕士就读于新加坡国立大学(NUS)计算机系。主要研究方向为大语言模型的推理能力。个人主页:(LLMs)实现严谨可信的推理,新国立提出
3年16亿营收!云天励飞迎来业绩增长
今日,云天励飞发布公告,公司与德元方惠签署《AI算力运营合作框架协议》。德元方恵将向云天励飞购买AI训练及推理异构算力服务,总算力规模约4000PFLOPS,该协议预计在未来三年服务期内为云天励飞贡献约16亿的营收。奠定未来的业绩基础作为国内领先的人工智能公司,云天励飞一直积极建设算力基座,并且对外提供算力运营服务。今年3月,云天励飞在发布会上公布了“1 3”业务布局,即基于1个算法芯片化平台,打造三大方向业务—AI方案、AI运营、AI产品。本次与德元方惠签署战略合作协议,是公司AI运营业务的一大突破,并在未来3年
10家国产大模型、GPT-4o共同挑战新鲜高考作文,还自我打分,谁是第一?
机器之能报道编辑:杨文10家国产明星大模型PK高考作文,谁是AI圈的笔杆子?高考这几天,AI 可真够忙的 ——考前忙着押题,考后忙着做题,甚至监考都得上阵。6 月 7 日上午,备受瞩目的 2024 年高考正式开始。第一场语文,毫无意外爆上热搜,全是跟作文有关。其中新课标 I 卷直接拿「人工智能」做文章。有网友认为,今年的高考作文题目真简单,还有网友觉得想写出彩要费点心思。那么,当 AI 遇上高考作文,能碰撞出怎样的火花?我们决定使用国产明星大模型,尝试写一写高考作文,与各位考生「一较高下」。参赛选手包括 ——百度家