资讯列表
DeepMind悄悄发布PaliGemma二代,最易微调「视觉语言全能王」来了,多项任务登顶SOTA
OpenAI的发布会仿佛连续剧,让人眼花缭乱,谷歌也悄悄发布了PaliGemma 2模型,迈向可调视觉语言模型的下一代。 今年5月,谷歌发布PaliGemma,也是Gemma家族中的第一个视觉语言模型,致力于模型民主化,降低视觉模型的使用难度。 PaliGemma 2模型以更高性能的Gemma 2为基座,增加了视觉能力,微调起来更容易,性能也更好。
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
在人工智能领域,我们一直以为顶尖的多模态大模型已经无所不能,GPT-4o在ASR(音频转文字)任务上已经达到了97%的正确率,更是凸显了强大的音频理解能力。 然而,最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小! 下面是一个例子:结果让人难以置信:这些顶尖的AI模型都未能准确判断出音量的差异!
CIO分享:什么时候数据太干净而无法用于企业AI?
数据质量对于AI项目的成功至关重要,但你需要保留原始数据的丰富性、多样性和完整性,以免破坏结果。 数据管理曾经是数据仓库团队的职责,如今已经越来越多地成了高管层的优先事项,数据质量被视为客户体验和业务绩效的关键。 但除了数据孤岛和合规性问题外,数据质量差也阻碍了企业AI项目的发展。
未来工厂,AI 领航 | 年终盛会,中信泰富特钢、施耐德、博世、工业富联等大咖共探 AI 赋能工厂新范式
2017 年,国务院发布《新一代人工智能发展规划》,制定了面向 2030 年的宏伟蓝图。 将战略重心定位于人工智能与实体经济的深度融合,既彰显了我国在人工智能发展道路上的战略眼光和创新思维,更为科技创新指明方向,为实体经济转型升级注入新动能。 其中,推动人工智能与制造业深度融合成为关键突破口。
统信 UOS AI 2.0 发布,deepin(深度)系统社区用户超 760 万
统信软件发布 UOS AI 2.0,带来 3 大系统级交互感知、AI 效率办公全家桶,以及 AIOS 生态的全面升级。对比第一代,UOS AI 2.0 带来了很多原生 AI 的功能和场景,比如 AI 搜索、AI 随航、AI 任务栏。
DeepSeek V2 系列 AI 模型收官,联网搜索上线
DeepSeek 官方公众号昨日(12 月 10 日)发布博文,宣布 DeepSeek V2 系列收官,推出 DeepSeek V2.5 的最终版微调模型 DeepSeek-V2.5-1210,主要支持联网搜索功能,全面提升各项能力。
聊天机器人平台 Character.AI 在美再遭起诉:对青少年及家庭构成威胁,恶化心理问题
据Popular Science今日报道,提供个性化聊天机器人服务的平台Character.AI,最近再次面临诉讼,因其对青少年用户的行为涉嫌造成“严重且无法弥补的伤害”。
YouTube 自动配音功能推广至更多知识类频道,借助 AI 生成视频多语言配音
YouTube当地时间周二宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。
久等了!希望这篇万字长文能帮助入门的朋友彻底搞懂车道线检测(中科院最新综述)
写在前面大家好,很荣幸能受到自动驾驶之心的邀请来为大家分享我们的一篇关于单目车道线检测的综述。 与papaer里展现的顺序和内容可能有所不同,在这里笔者想更多地讲一讲本文的成文过程以及各类方法的发展史,因此对于各方法的详细介绍读者可以参考本文原文,这里不会花费过多笔墨来重述。 关于本文原文中提到的方法,以及更多未提到的方法的论文和代码均可在笔者构建的GitHub仓库里找到,笔者后续也会不断更新,欢迎大家关注,也欢迎业内同仁指正,共同探讨。
OpenAI员工意外泄露下一代ChatGPT!网友:故意的还是不小心的?
OpenAI员工发推介绍今天发布的新功能,结果意外泄露了未发布的模型? 在Reddit上,被列文虎克附体的网友发现,OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字——ChatGPT ε(第五个希腊字母,读作Epsilon)。 这名网友猜测,这极可能就是之前被传出的下一代模型“猎户座”。
硅谷公司在旧金山街头投放争议性广告:“停止雇佣人类”
近日,一家名为 Artisan 的 AI 初创公司在硅谷中心地带旧金山投放了大量广告,其广告语简单粗暴 ——“停止雇佣人类”,引发广泛争议。
江山控股旗下 AI 公司突然宣布解散:资金无以为继,全体员工解聘
多位鹰眼智慧中医员工向新浪科技表示,在 12 月 9 日半夜 23:31 分,公司战略管理部总经理兼总裁办公室主任吕继有突然在企业微信全员群里发布了解散通知。
豆包电脑版上线视频生成功能,部分用户可体验
记者获悉,近日,字节跳动视频生成模型 PixelDance已在豆包电脑版正式开启内测,部分用户已开通体验入口。 内测页面显示,用户每日可免费生成十支视频。 PixelDance视频生成模型于9月底首次发布,最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测,外部对其多镜头组合、运镜切换及人物运动能力评价较好。
面壁智能获新一轮数亿元融资,高效端侧智能持续引领行业发展
近日,面壁智能完成新一轮数亿元融资,本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投,万甲资本担任本轮独家财务顾问。 本轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。 面壁智能是以「高效为第一性原理」的大模型公司。
微软为 Win11 推出“原生”Copilot 应用,但本质仍是一个网页
微软正在 Windows 11 上测试 Copilot 应用的新更新,据微软称,该更新将其从由 Edge 驱动的网络应用转变为“原生”的 Windows 11 应用。然而据 WindowsCentral 报道,除了外观上的变化,Copilot 的实际功能体验仍然依赖于网页,与之前的版本并无本质区别。
IBM 全新光学技术可缩短 GPU 闲置时间,大幅加快 AI 模型训练速度
IBM 宣布开发出一种新的光学技术,能够以光速训练 AI 模型,同时大幅节省能源。该公司表示,通过将这项突破应用于数据中心,训练一个 AI 模型所节省的能源相当于 5000 个美国家庭一年的能源消耗。
今天,ChatGPT升级为生产力工具:Canvas全量开放,人+AI协作模式启动
这就是大模型最好的应用方式? 今天是 OpenAI 十二天连更的第四天,OpenAI 准备革新的是生产力。 是的,就是 OpenAI 在 10 月份宣布的「ChatGPT 写作和编程新方式」,Canvas。
第十六批 18 组推荐使用外语词中文译名公布,AIGC 有了中文名“人工智能生成内容”
据新华社10日消息,外语中文译写规范部际联席会议专家委员会审议通过第十六批18组推荐使用外语词中文译名。本次拟推荐使用的外语词中文译名,均为与人工智能、信息技术等相关的词条。