资讯列表
还得是抖音,字节推出竖屏视频理解数据集,入选CVPR2024
短视频在当下社交媒体逐渐成为主导的视频格式。传统视频处理技术和研究一般都专注于横屏视频的理解和解析,而竖屏视频因其拍摄手法和内容重点不同,展示出与横屏视频数据不同的特性。针对这一不同,字节跳动技术团队发布了专注于竖屏视频理解的数据集,提出了多个针对竖屏视频处理的技术点以及一个初始方案。这项研究对准确的竖屏视频理解和基础技术架构有较为重要的意义,论文已入选 CVPR2024。视频 demo 展示、数据特性演示以及竖屏视频类别分类,请见 :,对视频内容的分类、特征提取,以及推荐等有着重要的作用。竖屏视频是目前社交媒体平
美国 FTC 否决将“刷脸”作为验证用户年龄方式
综合 eurogamer 等媒体报道,美国联邦贸易委员会(FTC)近日否决了引入“隐私保护面部年龄估算”技术的计划,该技术据悉可以分析用户面部的几何结构,来确定用户的年龄。图源 Pixabay去年七月,娱乐软件评级委员会(ESRB)、身份软件公司 Yoti 以及青少年营销公司 SuperAwesome 提交了使用该技术的申请。IT之家从 FTC 方面获悉,该技术旨在执行《儿童在线隐私保护规则》(COPPA),COPPA 要求面向 13 岁以下儿童的在线网站和服务,以及“实际知道”自己在收集 13 岁以下儿童个人信息
Anthropic 用 256 轮对话「灌醉」大模型,Claude 被骗造出炸弹
【新智元导读】Anthropic 发现了大模型的惊人漏洞。经过 256 轮对话后,Claude 2 逐渐被「灌醉」,开始疯狂越狱,帮人类造出炸弹!谁能想到,它的超长上下文,反而成了软肋。大模型又被曝出安全问题?这次是长上下文窗口的锅!今天,Anthropic 发表了自己的最新研究:如何绕过 LLM 的安全限制?一次越狱不够,那就多来几次!论文地址: Claude3 一家叫板 OpenAI 之余,Anthropic 仍然不忘初心,时刻关注着他的安全问题。一般情况下,如果我们直接向 LLM 提出一个有害的问题,LLM
谷歌挖走 OpenAI 大将,前开发者关系负责人 Logan Kilpatrick 官宣加盟
【新智元导读】AI 人才争夺战拉响!谷歌四大高管挖走了 OpenAI 前开发者关系负责人 Logan Kilpatrick。他将 AI Studio 产品,并为 Gemini API 提供支持。网友纷纷看好谷歌。入职整整一个月后,OpenAI 前开发者关系负责人 Logan Kilpatrick 正式官宣加入谷歌。他将负责 AI Studio 产品,并为 Gemini API 提供支持。Logan 表示,未来还有很多工作要做,让谷歌成为开发人员使用 AI 进行开发的最佳场所。Logan 加入谷歌是收到了来自谷歌四位
Katy Perry 等众多音乐人联名发公开信,抵制 AI 取代人类艺术家
Katy Perry、Billie Eilish 等知名音乐人与众多同行联名致信开发者,呼吁不要用人工智能 (AI) 取代人类艺术家。图源 Pexels据IT之家了解,随着 AI 技术逐渐渗透音乐行业,可能危及音乐人士的生计。这些明星选择通过一封公开信表达诉求,强调他们不希望这项技术取代人类艺术家所拥有的原始才华和技能。据 Axios 报道,这封联名信上还有 Elvis Costello、Norah Jones、Nicki Minaj 等来自不同音乐流派的知名音乐人签名。信中写道:“我们呼吁所有 AI 开发者、科技
暴雪:我们没有在《魔兽世界》中使用生成式 AI
《魔兽世界》游戏总监约翰・海特(John Hight)近日表示,他们没有在游戏中使用生成式 AI。海特在 GDC 2024 上与 IGN 的对话中表示:“团队艺术家担心 AI 会让他们失业,他们当然不希望自己的作品未经许可就被随意使用,或是没表明出处,暴雪现在仍在解决这个问题。”同时他坚持表示不会在《魔兽世界》中使用生成式 AI。同时海特表示,他们将机器学习作为一项实验,其结果令他们感到满意,他们已经使用机器算法帮助《魔兽世界》24 个种族配备了新的护甲套装,“以前我们的美工需要为人形打造护甲,然后再根据各种体型、
抖音发布清明期间内容创作提醒:慎用“AI 复活”技术
抖音安全中心日前发布公告,清明是我国慎终追远、访春踏青的节日,许多用户会在清明期间祭扫、出游并通过网络与亲友分享生活。平台观察到,有部分用户发布的内容不符合社区规则。平台给用户下列提醒:1、文明过节:请勿借清明节发布迷信、猎奇和有违公序良俗的内容,如配冥婚、鬼魂附体、坟头蹦迪、烧“二奶”纸扎等。2、爱护人民币:请勿发布焚烧人民币的内容。故意毁坏人民币是违法行为,可以通过其他文明、合法的方式表达对亲人的缅怀。3、尊重英烈:参观英雄、烈士及遇难同胞纪念场所时,应保持庄重的言谈举止,切勿发布在上述场所营销、喧哗或扰乱秩序
来华卖大模型:亚马逊举办生成式 AI 沟通会,消息称已收到大量中国公司合作需求
据晚点 LatePost 报道,4 月 2 日,亚马逊云科技(AWS 在中国的名称)在北京举办生成式 AI 沟通会,重点展示了一个月前发布的 Claude 3 系列大模型。报道援引一位亚马逊云科技人士消息,AWS 未在中国境内的服务器上部署 Claude 3。和微软 Azure 一样,中国公司可以通过 AWS 全球提供的 Bedrock 服务,申请调用在其他地区部署的 Claude 3 模型并完成计算。这名科技人士还称,Claude 3 系列模型发布后,他们收到了大量中国公司的合作需求。IT之家曾在上月报道,亚马逊
亚马逊课程免费学!4小时快速入门生成式AI
大家好,这里是和你们一起探索 AI 的花生~
AI 技术已经发展得越来越成熟了,相关的工具也早已融入到我们的工作和生活中。各种生成式 AI 工具,比如聊天机器人、智能绘画工具等大家可能早就能熟练使用了,但生成式 AI 到底是什么、它是如何改变我们的生活的、未来会有哪些发展趋势这些问题你又了解多少呢?
今天为大家推荐一门非常好的通识课程,它能帮我们迅速了解生成式 AI 的最新知识,理解 AI 对于商业的价值以及该如何正确地使用生成式 AI。课程不仅免费,学完后通过测试还能获得官方颁发的证书,帮助我们提升职场竞争力,一
钉钉AIGC实践!如何用AI一键设计工作台应用图标?
钉钉工作台作为组织数字化的入口,不同企业通过工作台打造属于自己的门户,不仅可以帮助员工快速找到各种功能,更能成为打造企业组织文化的重要阵地,是企业品牌形象的一块亮眼招牌。一、为什么要AI生成应用图标
在客户案例中,典型行业大客户的自定义工作台体现了企业文化和品牌形象,样式设计也十分丰富多样。自定义工作台首页的图标通常会进行重新设计和替换,以更好地契合企业的品牌设计和文化氛围。然而在用户反馈中,我们发现这样的声音:有时客户企业内没有设计师无法进行个性化设计,又或者自行设计的效果不理想;有时已经进行了图标设计和替换,但
微软正在测试 Xbox AI 聊天机器人:可自然语言获取 Xbox 支持信息
据 The Verge 报道,微软内部正在测试一款 Xbox AI 聊天机器人 —— Xbox Support Virtual Agent(Xbox 支持虚拟代理),可使用自然语言获取 Xbox 支持信息。我们正在测试 Xbox Support Virtual Agent,这是一个内部原型阶段的动画角色,可以通过语音或文字查询 Xbox 支持话题。这个原型使得玩家可以使用自然语言获取帮助,相较之前更加便捷快速,这些信息来自现有的 Xbox 支持页面。—— Xbox 游戏 AI 负责人 Haiyan Zhang▲ 现
底薪即为普通员工均薪 3.57 倍,三星以优厚待遇为 AGI 计算实验室延揽人才
据韩媒 Sedaily 报道,三星电子正以优厚待遇为其新成立的 AGI(通用人工智能)计算实验室招募 AI 领域人才,开出的年度底薪就有 5 亿韩元(IT之家备注:当前约 267.5 万元人民币)。根据韩国 CXO 研究所 2022 年的数据,当时三星电子普通员工的平均年薪为 1.4 亿韩元,5 亿韩元是这一数值的 3.57 倍。三星 AGI 计算实验室于 3 月宣布成立,在韩美两国均设有机构,由前谷歌开发人员禹东赫(Dong Hyuk Woo)领导,致力于开发出能满足未来 AGI 计算需求的全新类型半导体。该实验
英伟达开卷价格!最新 Blackwell GPU 架构 / 成本揭秘,彰显老黄的「仁慈」
【新智元导读】老黄新 GPU 深夜炸场,超高规格的背后也付出了不小的代价,小编带大家深入了解一下新架构的硬件细节和成本,新显卡的售价究竟高不高?英伟达也不得不开始卷了老黄的新 GPU 又在深夜炸场,震撼了所有的观众。除了硬件参数上的震撼之外,大家伙最想知道的还是新 GPU 的售价会不会同样震撼。下面就让我们从规格参数、工艺节点、封装设计等方面来深入分析一下新一代 Blackwell GPU 的系统、定价、利润,以及 Jensen's Benevolence(老黄的仁慈)在这个大模型的时代,英伟达正处于世界之巅,拥有
ChatGPT 也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝
尴了个大尬!人们还在嘲讽有人用 ChatGPT 写论文忘了删掉“狐狸尾巴”,另一边审稿人也被曝出用 ChatGPT 写同行评论了。而且,还是来自 ICLR、NeurIPS 等顶会的那种。来自斯坦福的学者对一些顶级 AI 会议(如 ICLR、NeurIPS、CoRL 等)中的审稿意见进行了分析,结果发现 ——在 ChatGPT 出现之后,这些同行评论的“AI 含量”大增,最多的高达 16.9%,而有 ChatGPT 之前这个比例大约是 2%。证据也很直观,AI 常用的词汇出现频率,在 ChatGPT 发布之后噌的一下
清华创业团队帮你造梦,Idea秒变微电影,最长可达数十分钟!
机器之能报道编辑:Cardinal开创性地将多模型智能体协作技术引入视频领域,只需要输入一句话,Dream Factory 就会自动生成完整的剧本和视频。它是剧本作者,亦是视频导演。AI 生成视频场景、情节单一是当下大模型的通病 随着大模型的飞速发展,文字生成视频领域迅速火爆。然而,目前的文字生成视频通常是一句话生成单场景、单情节的视频,即使是头部视频大模型发布的东京佳人、雪地幼犬等视频 Demo,亦逃不开单场景、单情节的限制。在实际应用过程中,用户更需要的是多场景、多情节、有故事性的视频,将文字生成多场景、多情节
2个月不见,人形机器人Walker S会叠衣服了
机器之能报道编辑:吴昕国内版的人形机器人 大模型组队,首次完成叠衣服这类复杂柔性材料的操作任务。随着融合了 OpenAI 多模态大模型的 Figure 01 揭开神秘面纱, 国内同行的相关进展一直备受关注。就在昨天,国内“人形机器人第一股”优必选发布了人形机器人 Walker S 深入融合百度文心大模型后的首个 Demo,展示了一些有趣的新功能。视频链接:,得到百度文心大模型能力加持的 Walker S 是这个样子的。视频链接: Figure 01 一样,Walker S 没有走动,而是站在桌子后面完成一系列任务。
少量数据实现高通用性,KAIST开发药物设计3D分子生成新框架
编辑 | 萝卜皮深度生成模型具有加速药物设计的巨大潜力。然而,由于数据有限,现有的生成模型常常面临泛化方面的挑战,导致设计创新性较差。为了解决这些问题,韩国 KAIST 的研究人员提出了一种相互作用感知的 3D 分子生成框架,该框架能够在靶标结合口袋内进行相互作用引导的药物设计。通过利用蛋白质-配体相互作用的通用模式作为先验知识,该模型可以利用有限的实验数据实现高度的通用性。通过分析生成的未见靶标配体的结合姿势稳定性、亲和力、多样性和新颖性等,对其性能进行了全面评估。此外,潜在突变选择性抑制剂的有效设计证明了该方法
全球首个涉 AI 安全双边协议,英美两国建立人工智能安全科学合作伙伴关系
感谢美国东部时间 4 月 1 日晚,美国和英国签署了一项具有里程碑意义的 AI 相关协议,双方宣布建立人工智能安全科学合作伙伴关系。这也是全球首个关于人工智能安全的双边协议。该协议明确,英国去年 11 月成立的新 AI 安全研究所和美国同类机构,将通过借调两国研究人员来互相交流专业知识。图源 Pixabay此外,两家机构还将开发一种共同的人工智能安全测试方法,包括使用相同的方法和底层基础设施,双方将根据国家法律法规和合同,寻求员工交流和信息共享。新闻稿还称,双方拟将在一个“可公开访问”的 AI 模型上开展联合测试。