资讯列表
使用 OCR 识别手写文本
本文实现了基于微调TrOCR模型进行手写文本识别。 1.GNHK手写笔记数据集GNHK(GoodNotes Handwriting Kollection)手写笔记数据集由GoodNotes提供,包含来自世界各地学生的数百份英文手写笔记。 下载数据集访问GNHK数据集官方网站:(),滚动到底部,同意使用条款和条件;点击第二个链接下载数据集。
亚马逊 AWS 将使用 AI 开发的材料来减少数据中心碳排放
亚马逊云服务业务 AWS 今日宣布与一家名为 Orbital Materials 的公司建立合作关系,后者使用 AI 来开发脱碳技术。
3DGS自监督预训练全新范式!VisionPAD:三大感知任务全部暴力涨点(港中文&华为)
写在前面 && 笔者理解虽然近一年端到端的自动驾驶发展火热,但是以多视角图像推导BEV视角和占用空间的感知技术引领的自动驾驶框架,仍然在很多企业中占据主体。 比如今天要分享的这篇,就是华为诺亚方舟实验室对BEV OCC的继续研究。 但是不得不说,这些模型在很大程度上依赖于精确的3D标注,而数据标注的高成本使得越来越多的研究人员和工程师开始关注预训练策略。
大幅超越所有SOTA!地平线DiffusionDrive:生成式方案或将重塑端到端格局?
写在前面&笔者的个人理解近年来,由于感知模型的性能持续进步,端到端自动驾驶受到了来自工业界和学术界的广泛关注,端到端自动驾驶算法直接从原始传感器采集到的信息输入中学习驾驶策略。 这种基于数据驱动的方法为传统的基于规则的运动规划提供了一种可扩展且强大的替代方案,而传统的基于规则的运动规划通常难以推广到复杂的现实世界驾驶环境。 为了有效地从数据中学习驾驶过程,主流的端到端规划器通常从自车查询中回归出单模轨迹,如下图所示。
消息称三星和 SK 海力士达成合作,联手推动 LPDDR6-PIM 内存
三星电子的一位代表表示:“两家公司正在交换意见,并就产品标准化进行合作,”他补充说:“由于合作刚刚开始,我们正在制定标准化目标时间表的实施计划。”
轻松掌握 AI 大模型!Windows 新突破:Ollama 赋能本地部署
Ollama—— 这是一个专为本地部署优化的 AI 模型。 Ollama 在模型大小、性能和部署灵活性等方面都有非凡的表现,与传统云端部署相比,它可以轻松运行在普通的台式电脑或笔记本电脑上。 这无疑是 AI 大模型的一次重大突破!
为什么在人工智能时代基础设施必须是无服务器的
开发者们正从创建单个应用程序转向编排由 AI 构建的应用程序集群。 译自Why Infrastructure Must Be Serverless in the AI Age,作者 Nikita Shamgunov。 Replit 的新 AI 代理将编写您的代码,然后配置、调配、构建和部署该代码,只需几秒钟。
李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则
就在刚刚,李飞飞空间智能首个项目突然发布:仅凭借1张图,就能生成一个3D游戏世界的AI系统! 重点在于,生成的3D世界具有交互性。 能够像玩游戏那样,自由地移动相机来探索这个3D世界,浅景深、希区柯克变焦等操作均可行。
终于把 LSTM 算法搞懂了!!!
今天给大家分享一个强大的算法模型,LSTMLSTM(长短期记忆网络)是一种特殊类型的循环神经网络(RNN),它能够有效地解决传统 RNN 在处理长序列时遇到的梯度消失和梯度爆炸问题。 LSTM 的核心思想是通过多个门控机制来控制信息的流动,这些门控机制可以选择性地保留或丢弃输入数据,从而帮助网络捕捉长时间跨度的依赖关系。 LSTM的工作原理LSTM 的核心思想是通过引入记忆单元来存储信息,并使用三个主要的门(输入门、遗忘门、输出门)来决定哪些信息应该保留,哪些信息应该遗忘,以及哪些信息应该更新。
最大限度提高人工智能训练效率:选择合适的模型
译者 | 李睿审校 | 重楼快速准确地训练人工智能模型,对于建立对这些工作流工具的信任非常重要。 随着人工智能驱动的应用程序执行复杂任务的能力越来越强,数据科学家和机器学习工程师需要探索新方法。 要为特定用例开发最佳模型,利用合适的模型、数据集和部署可以简化人工智能开发过程并产生最佳结果。
Arc 浏览器开发商预告全新 AI 浏览器 Dia,计划 2025 年初推出
该公司最新的宣传片显示该产品为 Dia,这是一个利用 AI 工具简化日常互联网任务的网络浏览器,计划于 2025 年初推出。
地瓜机器人与清华大学达成全面深度合作,推出 RDK UniBots 具身智能科教平台
该平台是具身智能科教的标准化体系架构,以RDK算力平台与板载具身智能算法为基础,融合了机器人产业与科教产业上下游,可支持用户根据个性化需求,快速创建具身智能科教应用。
杭州滨江公安投用人形机器人:可语音播报反诈信息,巡逻时支持全程录音录像
综合滨江发布、滨江公安等消息,在11月30日-12月1日凤凰传奇杭州演唱会期间,杭州滨江公安的“新成员”——人形机器人在大莲花体育场周边亮相。
OpenAI 称考虑在人工智能产品中引入广告,开辟新的收入来源
据英国《金融时报》今晚报道,OpenAI 正在考虑在其人工智能产品中引入广告。目前该公司正处于向盈利性企业转型的过程,试图开辟新的收入来源。
陈天桥披露盛大公司 AI 战略:布局智能商业决策、突破算法茧房的内容分发等
陈天桥透露,盛大将在AI领域布局三大产品方向:商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。
离职OpenAI后,翁荔博客首次上新,引众网友围观学习(中文全文)
大约一个月前,OpenAI 安全系统团队负责人翁荔(Lilian Weng)在 X 上宣布了从已经工作了近 7 年的 OpenAI 离职的消息。 当时,她就曾表示,之后可能有更多时间来写博客。 刚刚,翁荔更新了一篇博客,迅速引起了大家的围观学习。
统信软件 2024 中国操作系统大会定档 12 月 10 日,发布最新 AIOS 产品
统信软件今年 8 月发布中国首款操作系统级端侧模型 UOS LM,支持问答、翻译、创作等。
消息称华为正联合中国移动、乐聚机器人开展 5.5G 网络场景的机器人应用
科创板日报今日报道称,华为正联合中国移动、乐聚机器人开展5.5G网络场景下的机器人应用,面向B端和C端的多种场景。