应用
谷歌扩展 AI 总结搜索结果功能至全球 100 多个市场,覆盖 10 亿月活用户
感谢谷歌公司昨日(10 月 28 日)发布博文,宣布在全球 100 多个国家和地区扩展 AI Overviews in Search 功能,覆盖全球 10 亿月活跃用户。 AI在线注:谷歌公司于今年 5 月在美国启动 AI Overviews in Search 功能,并于今年 8 月扩展到部分美国以外的市场,该功能主要用于 AI 总结搜索结果,让用户找到更契合的搜索结果。 谷歌在博文中表示,将于本周开始将会在全球 100 多个国家和地区推出 AI Overviews 功能,覆盖全球 10 亿月活跃用户。
2024 科大讯飞全球 1024 开发者节:AI 文娱论坛“重构内容与表达”完满落幕
10 月 24 日,2024 科大讯飞全球 1024 开发者节 AI 文娱论坛在合肥圆满举办。 论坛以“重构内容与表达”为主题,旨在探讨 AI 时代下文娱产业的最新趋势,见证讯飞 AI 文娱业务的重大发布,与合作伙伴共同推动文娱行业的繁荣发展。 科大讯飞副总裁 & 研究院院长刘聪、科大讯飞消费者事业群副总裁严亚路出席大会,讯飞输入法业务部总经理程坤、数字娱乐业务部总经理 & 讯飞音乐主理人郭嘉、数字娱乐业务部副总经理 & 讯飞音乐首席科学家江源分别作主题演讲。
一张显卡“看懂”一部电影:智源联合高校开源 Video-XL,打破长视频理解极限
长视频理解是多模态大模型的核心能力之一,也是迈向通用人工智能(AGI)的关键一步。 然而,现有的多模态大模型在处理 10 分钟以上的超长视频时,仍然面临性能差和效率低的双重挑战。 对此,智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校,推出了小时级的超长视频理解大模型 Video-XL。
先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了
这才是未来 AI 该有的样子? 奇怪了。 一款 AI 代码工具刚发布,限量测试却要求「不懂代码」的人优先。
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能,将极大地丰富人类用户与 AI 智能体互动的体验。 上个月,谷歌宣布对旗下 AI 笔记应用 NotebookLM 进行一系列更新,允许用户生成 YouTube 视频和音频文件的摘要,甚至可以创建可共享的 AI 生成音频讨论。 加上此前支持的谷歌文档、PDF、文本文件、谷歌幻灯片和网页,NotebookLM 的用例和覆盖范围进一步扩大。
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果
近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。 DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。 论文链接:::。
Perplexity AI 搜索引擎每周处理 1 亿次查询,消息称微软 / X / OpenAI 有意收购
综合 TechCrunch、The Information 报道,AI 搜索引擎 Perplexity 的首席执行官 Aravind Srinivas 透露,其产品目前每周的查询量已达到 1 亿次,推算下来每月约为 4 亿次,与 7 月的 2.5 亿次相比增长显著。 当地时间 25 日,该公司披露称,随着公司快速扩展,Perplexity 正在逐步推出电商功能,计划让“Perplexity Pro”服务的订阅用户享受一键下单的便捷功能。 同时,公司也在开发新的广告模式。
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
今年到 CNCC 现场参会的朋友,想必都对 CNCC 2024 举办所在地——超过 6200 亩的横店圆明新园印象深刻! 虽然园内建筑身临其境,并且薅了主办方一把羊毛,免门票游览了圆明新园与横店多个著名旅游景点,但园子实在是太大了。 参会人数超过 1 万 2,园内车辆、美食供不应求,小编表示腿已经走断。
轻舟智航完成数亿元C+轮融资,加速从L2++到L4级自动驾驶的渐进式进化
10月28日,轻舟智航(QCraft)宣布完成数亿元人民币C 轮新融资。 本次融资由逐鹿聚航基金投资,资金将用于加大全栈自动驾驶技术的研发投入,扎实推进中高阶NOA方案的大规模量产交付,以持续、高效的量产数据积累驱动技术迭代,稳步实现从L2 到L4级自动驾驶技术的渐进式进化,推动L4级自动驾驶时代的全面到来。 轻舟智航联合创始人、CEO于骞表示:“感谢逐鹿聚航基金对轻舟智航的坚定支持与信任!
OpenAI 语音转写工具 Whisper 被曝存在重大缺陷:会凭空生成大段虚假内容
当地时间 27 日,据美联社报道,超过十位软件工程师、开发人员和学术研究人员称,OpenAI 的语音转写工具 Whisper 存在一个重大缺陷:有时会凭空生成大段甚至整句虚假内容。 这些专家指出,这些生成的文本(AI在线注:业内通常称为“AI 幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。 专家们认为,这一问题尤其令人担忧,因为 Whisper 已被广泛应用于全球多个行业,包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。
因使用生成式 AI 制作恶意软件,日本一 25 岁男子首次被判有罪
据《读卖新闻》25 日报道,日本一名 25 岁林(Hayashi)姓男子因滥用生成式 AI 制造电脑病毒,被东京地方法院判处有期徒刑三年,缓期执行四年,标志着日本首次有因滥用生成式 AI 作出刑事定罪的案例。 据判决书等资料显示,去年 3 月 31 日,该男子左右在川崎市的住所中利用电脑和智能手机,通过生成式 AI 获取的恶意程序设计图(源代码)制作了类似勒索软件的电脑病毒。 此外,他还冒充他人骗取了手机通信卡等物品。
抖音:严厉打击利用 AI 骗取老年人互动,下架违规视频、处置违规账号
抖音官方于 10 月 25 日发布《抖音严厉打击利用 AI 骗取老年人互动的治理公告》。 抖音官方表示,鼓励创作优质内容,包括采用 AI 技术进行辅助创作,但所创作内容必须遵循平台规范。 平台对利用生成式人工智能技术创作和发布违背科学常识、弄虚作假、造谣传谣的内容进行持续打击。
OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍
OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。 与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,号称能够将文生图效率提升约 50 倍,且生成的样本质量能与“业界较强的扩散模型”相比较,为 AI 文生图提供了新的方案。 目前业界通常使用扩散模型生成图片及音视频,但传统扩散模型的取样过程通常缓慢,通常需要数十到数百个逐步降噪的过程才能生成高质量样本(例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间),这使得相应模型效率低下,不适合商业化应用。
丹麦首台 AI 超级计算机 Gefion 推出,由 1528 个英伟达 H100 GPU 驱动
丹麦推出了该国首台 AI 超级计算机,以丹麦神话中的女神 Gefion 命名,旨在推动量子计算、清洁能源、生物技术等领域取得突破,英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。 ▲ 图源英伟达Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机,使用英伟达 Quantum-2 InfiniBand 网络进行互连。 AI在线获悉,Gefion AI 超级计算机位于哥本哈根,为产业界、初创企业和学术界服务。
谷歌 DeepMind 开源 SynthID Text 工具,可辨别 AI 生成的文字
谷歌 DeepMind 于 10 月 23 日宣布正式开源旗下 SynthID Text 文本水印工具,供开发者和企业免费使用。 谷歌在 2023 年 8 月推出了 SynthID 工具,该工具具备创建 AI 内容水印(声明该作品由 AI 打造)和识别 AI 生成内容的能力。 它可以在不损害原始内容的前提下,将数字水印直接嵌入由 AI 生成的图像、声音、文本和视频中,同时也能扫描这些内容已有的数字水印,以辨识它们是否由 AI 生成,不过本次谷歌开源的仅为针对文本生成的 SynthID Text。
Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动设备
继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后,Meta 于 10 月 24 日发布了这两个模型的量化版本,量化后的模型大小平均减少了 56%,RAM 使用量平均减少了 41%,模型速度提高了 2 至 4 倍,同时降低了功耗,使这些模型能够部署到更多移动设备上。 AI在线注:模型量化(Model Quantization)就是通过各种训练方式将浮点模型转为定点模型,可以压缩模型参数,降低模型的复杂性,以便于在更轻量的平台运行。 Meta 表示,他们采用了量化感知训练(Quantization-Aware Training,QAT)和后训练量化(SpinQuant)两种方法对模型进行量化,其中“量化感知训练”更重视模型的准确性,而“后训练量化”更强调模型的可移植性。
深圳一家公司造出世界上最酷机器人,卖2-3万美元
网友:终于不是太奶步伐了。 国内惊现「无头」机器人! 造出这个机器人的,是一家名叫众擎机器人(EngineAI)的深圳公司。
谷歌这款新概念键盘,治好了我多年的老病
谷歌终于把人机交互给玩明白了? 很多整天对着电脑的同学们难免腰酸背疼,有时会发出这样的感叹:我对这键盘受够了! 那么问题来了:应该换个机械键盘还是分体式键盘呢?