资讯列表

英国零售业拥抱自动化以降本增效,机器人包装工、AI 摄像头等逐渐普及

据英国《卫报》21 日报道,为了应对不断上涨的劳动力成本,英国零售商正加快采用电子货架标签、自动退货机、机器人包装工以及更多自助结账设备。

Claude 创始人:AI 全面超越人类,只剩 2-3 年

他认为,AI 确有可能在短期内替代部分人类的工作,但让 AI 与人类形成互补才是对生产力最有益的方式。

ChatGPT 每月产生 260 吨二氧化碳,与 260 趟纽约至伦敦航班碳排放相当

随着科技不断发展,进入 2025 年后,如何在技术创新和环境可持续性之间取得平衡,将成为科技企业和用户必须关注的核心议题。

谷歌母公司 Alphabet 总裁:美国 AI 技术未必会永远领先中国

据彭博社报道,Alphabet 公司总裁兼首席投资官鲁斯・波拉特(Ruth Porat)表示,美国在人工智能(AI)发展竞赛中未必能保持对中国的领先优势。

灵敏度高达94.9%!牛津团队AI多模态ctDNA检测方法,进行癌症早期筛查

编辑 | 2049在癌症诊疗的漫长征程中,早期检测始终是最具挑战性的环节之一,液体活检技术因其无创性和高灵敏度而备受关注。 然而,现有的检测方法大多依赖于深度靶向测序,难以同时整合多模态数据,导致检测灵敏度和特异性受限。 正是基于这一技术痛点,牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序(TAPS)的多模态循环肿瘤 DNA(ctDNA)检测方法。

AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?

编辑 | 1984随着生成式 AI 技术的普及,学术界正面临着一个新的挑战:越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。 这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格,其危害不容忽视。 作为广受欢迎的学术搜索引擎,Google Scholar 在展示搜索结果时,并未区分这些可疑论文与经过严格质量把关的研究成果。

可灵视频生成可控性为什么这么好?快手又公开了四篇研究

可灵,视频生成领域的佼佼者,近来动作不断。 继发布可灵 1.6 后,又公开了多项研究揭示视频生成的洞察与前沿探索 ——《快手可灵凭什么频繁刷屏? 揭秘背后三项重要研究》。

「称霸」20年的谷歌翻译,一朝被小红书干沉默了

AI好好用报道编辑:杨文莲花脚皮片、硬气体毛……谷歌翻译闹出的那些国际笑话。 每天都在小红书上找乐子。 因为中外网友语言不通,唠嗑全倚仗谷歌翻译器。

百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%

据界面新闻今日援引多个知情人士消息称,字节跳动旗下的豆包大模型在去年大幅降价后,毛利率仍然为正。

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。

一款可快速定位照片的AI工具

由波士顿Graylark Technologies开发的GeoSpy是一款强大的AI工具,可通过分析图像中的建筑风格、植被类型以及建筑物之间的空间关系等特征,在几秒钟内高精度定位照片的拍摄位置。 这项技术引起了公众和执法机构的广泛关注,其市场定位为执法部门、威胁情报公司和政府机构提供服务。 GeoSpy经过数百万张全球图片训练,能够识别“显著的地理标志”,如特定的建筑样式、土壤特征及其空间排列关系。

API存在安全风险:如何在不断发展的数字环境中保护数据

云计算和人工智能技术彻底改变了企业的运营方式。 这两种技术都提供了更高的灵活性和可扩展性。 基于云的基础设施使组织能够更快地进行创新。

截胡 OpenAI:清华复旦等抢先开源智能体框架 Eko,一句话打造「虚拟员工」

清华、复旦和斯坦福的研究者联合提出了名为 Eko 的 Agent 开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。

UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

来自π,伯克利和斯坦福的研究者近期提出了FAST,一种为VLA模型设计的高效动作Tokenizer。 FAST旨在解决传统动作Tokenization方法在处理精细任务时面临的挑战,为VLA模型在更复杂、高频的机器人控制任务带来了显著改进。 将FAST与π0 VLA结合,在1万小时的机器人数据上对π0-FAST进行训练,效果与最先进的扩散VLA相当,训练时间最多缩短5倍。

截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」

OpenAI的首席执行官Sam Altman最近宣布,2025年将推出「虚拟员工计划」,代号Operator,AI智能体能够自主执行任务,如写代码、预订旅行等,成为企业中的「数字同事」。 抢在OpenAI发布Operator之前,清华、复旦和斯坦福的研究者联合提出了名为Eko的 Agent开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。 AI智能体能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。

41%博士后逃生学术界,顶刊PNAS揭残酷真相!名校光环背后曝职业危机

去年,随着LLM产品化和工程化的发展,工业界的研究岗迅速缩减,许多AI博士面临巨大的就业压力,纷纷表示后悔读博。 工业界机会稀少,学术界同样问题重重。 为此,有的博士生甚至转行去当了主播。

36000亿元!OpenAI启动全球史上最大规模AI基础设施项目,英伟达软银甲骨文均参与

史上最大规模AI基础设施项目启动! 不久之前,OpenAI官宣了一项“星际之门”(The Stargate Project)计划——将与软银甲骨文组建合资公司,未来4年内总投资5000亿美元(约合3.64万亿元人民币)在美国建立多个AI数据中心。 该计划将立即启动,而且OpenAI一出手就准备先投它个1000亿美元。

几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的

试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进行标注,可能大部分人会认为这一粤语、英语混用的片段是真实发生或从TVB电视剧里截出来的。 但其实,这是由 AI 完成的配音,背后所使用的工具是海螺语音。 今年 1 月,继 MiniMax 发布并开源基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01 后,再次推出了升级的语音大模型 T2A-01 系列,搭载于海螺 AI 之上,开辟海螺语音板块。