资讯列表

字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”

据界面新闻3日消息,字节跳动旗下AI助手豆包现已上线图片理解功能,豆包App及豆包PC新增照片及相机按钮,上传图片后可识别图片内容。

平安人寿ChatBI:大模型智能化报表的深度实践

一、项目背景和目标1.  项目背景:大模型赋能智能 BI我们先来看一份报告,2023 年,国家发布了《数字中国发展报告》,报告显示我国的数字经济规模已经达到了 50 多亿,位居世界第二。 这一成就的取得,离不开像 ChatBI 这样的创新性产品的贡献。

我们能完全解决GAN中的模式崩溃问题吗?

译者 | 李睿审校 | 重楼事实上,生成式对抗网络(GAN)是人工智能领域中令人瞩目的应用之一。 GAN风靡全球,凭借生成逼真的图像、深度伪造(Deepfake)视频、人工智能生成的艺术作品,甚至合成的生物数据,其能力让人们惊叹不已。 但是GAN也有不为人知的秘密,这是工程师、人工智能爱好者和研究人员多年来面临的一个难题:模式崩溃。

日本文化厅将建立 AI 系统检测盗版网站,以避免数十亿美元经济损失

据法新社报道,为了遏制动漫和漫画的盗版行为,日本计划借助 AI 技术追踪相关网站,这些网站每年给该国造成了数十亿美元的经济损失。

索尼互娱联席 CEO:AI 可能“彻底变革”游戏领域,但人类开发仍不可或缺

BBC公布了对索尼互娱联席CEO Hermen Hulst 的访问内容,其谈到了人工智能对游戏行业的深远影响。Hermen Hulst认为,尽管人工智能可能会“彻底变革”游戏领域,但开发过程中人类的参与仍不可或缺。

苹果考虑使用亚马逊 AI 芯片来预训练其 Apple Intelligence 模型

苹果机器学习和人工智能高级总监 Benoit Dupin 今天意外现身亚马逊网络服务(AWS)re:Invent 大会。Dupin 透露,苹果在其许多云服务中使用来自亚马逊网络服务的定制人工智能芯片。苹果还在评估使用亚马逊最新的 AI 芯片来预训练其 Apple Intelligence 模型。

VBench直接干到了第一!这一次,视频生成「压番」全场的是家央企

高难度武打视频,也能「手拿把掐」。 回想起来,年初对国内文生视频技术迭代速度的预估还是保守了。 OpenAI 在 2 月发布 Sora 后,至今还是期货,但国内科技界迅速跟进,几乎月月有战报。

扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观

扩散模型和最优传输之间到底存在怎样的联系? 对很多人来说还是一个未解之谜。 但有一点很清楚的是:在相似的数据集上训练的不同扩散模型倾向于恢复出相似的映射关系。

开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

关于LLM-as-a-judge范式,终于有综述讲明白了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

用树莓派手搓《星际穿越》同款机器人,马斯克都忍不住点赞

AI好好用报道编辑:杨文电影照进现实。 2013 年,「实拍狂魔」诺兰拍了那部著名的《星际穿越》。 为了这部电影,诺兰不仅在加拿大北部开荒种出三千亩玉米地,还造出了一架真实大小的飞船和一台名为 TARS 的机器人。

AI 靠单图生成 3D 世界:李飞飞空间智能首秀,可像玩游戏一样探索

重点在于,生成的 3D 世界具有交互性。用户能够像玩游戏那样,自由地移动相机来探索这个 3D 世界,浅景深、希区柯克变焦等操作均可行。

大模型加持下的 Linux 操作系统开发和自动化维护实践

作为国产开源操作系统社区,OpenCloudOS从L1到L3全链路覆盖,从上游社区独立选型软件包,编译、运行不依赖任何其他发行版,做到自主维护、演进,独立修复bug、cve及backport等维护工作。 今年3月,OpenCloudOS已率先构建了一套全流程自动化的基础设施和工具平台,实现对3000 大规模软件包的全链路自主研发与自主维护:《如何实现对 3000 软件包的全链路自主研发与维护?》与此同时,OpenCloudOS进一步结合LLM/AI辅助功能,持续提升开发、维护效率和质量,让社区的开发者、软件包的维护者有更多的精力投入到对重要包的掌握和能力建设、新技术新特性的探索和研发中。 (本文基于2024.10.16 CID演讲整理)一、解决方案综述这套从上游跟踪到代码同步的全流程自动化维护工具平台,主要包括5个部分及对应的工具,其中红色标识的部分通过LLM/AI辅助进一步提升效率和质量。

中国电信“天翼”AI 手机发布:联合高通、中兴研发,端侧 3B 模型

“天翼”AI 手机基于中国电信星辰语义大模型能力,裁剪了一个 3B 的模型,并将该模型内置到高通芯片中,实现端侧 AI 能力,还支持与云侧 AI 协同。

腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放

130亿参数,成为目前参数量最大的开源视频生成模型。 模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。 实际效果如何呢?

3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天

AI生成3D世界成真了! 就在刚刚,AI教母李飞飞创立的World Labs首次官宣「空间智能」模型,一张图,即可生成一个3D世界。 用李飞飞的话说,「无论怎样理论化这个想法,都很难用语言描述一张照片或一句话生成3D场景的互动体验。

关于 YOLOv10 架构的简介

目标检测技术,这一受人类视觉能力启发的计算机视觉技术,已在数字图像和视频领域取得显著进展。 YOLOv10,作为YOLO系列的最新力作,以其卓越的性能和效率,继续在目标检测领域保持领先地位。 本文将探讨YOLOv10的技术特性、架构结构、优势和潜在劣势。

中国电信董事长柯瑞文:已构建“星海”数据智能中台,形成 9 万亿 Tokens 高质量数据集

在今日的 2024 数字科技生态大会上,中国电信董事长柯瑞文表示:聚焦重点场景,打造万兆下行、千兆上行的 5G 大带宽能力,推进 50G PON 宽带网络试点,建设万兆智能接入网络。