超越 OCR,谷歌 AI 技术 InkSight 可精准识别手写文字
Google Research 展示了一种使用人工智能读取手写内容的新方法,名为 InkSight 的系统能够直接从手写文字的图片中提取出数字文本,无需任何中间设备。 传统的手写文字识别技术主要依赖于光学字符识别 (OCR),但这种方法在处理复杂背景、模糊不清或低光照条件下的手写文字时往往表现不佳。 InkSight 则采用了不同的思路,通过模仿人类学习阅读的过程,即通过不断地重写文本,来学习整个…- 11
- 0
腾讯研发全球首个大熊猫模型:实时识别、统计、分析大熊猫行为并生成报告
腾讯 10 月 25 日宣布,为了帮助饲养员全方位观察大熊猫,腾讯、中国大熊猫保护研究中心、广东工业大学,联合打造了全球首个大熊猫行为智能识别模型及智慧系统。 AI在线获悉,该模型可以识别大熊猫进食、喝水、睡觉等日常行为,并自动生成日报、周报、月报等可视化数据报表。 项目组通过优化 SlowFast 算法,大幅提升了系统在遮挡环境下的行为识别能力,目前室内遮挡场景下的大熊猫行为识别准确率提升到了 …- 17
- 0
OpenAI GPT-4 解锁新成就:100% 识别性别、74.25% 识别年龄范围,未专门训练可媲美专业算法
科技媒体 The Decoder 昨日(10 月 9 日)发布博文,报道称最新研究表明 OpenAI 的 GPT-4 AI 模型在未经专门微调和训练情况下,能够识别面孔、判断性别,并在照片中估计年龄,其准确度媲美专业算法。来自挪威科技大学、Mizani 及 Idiap 研究所的研究人员推进这项研究,测试了 GPT-4 的生物识别能力,发现其性能和 MobileFaceNet 等专门的面部识别算法不…- 6
- 0
苏黎世联邦理工学院研究:AI 可 100% 绕过谷歌 reCAPTCHA V2 验证
据 Ars Technica 今日报道,苏黎世联邦理工学院博士生 Andreas Plesner 及其同事发表了一项新研究,研究重点放在了谷歌的验证码系统 reCAPTCHA V2 上。该研究声称,使用经过专门训练的图像识别模型运行的本地机器人在应对这类图片验证码时的表现,可以与人类相媲美,成功率达到了 100%。AI在线注:谷歌 reCAPTCHA V2 验证码通常会向用户提供一组图片,要求识别…- 29
- 0
谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群
据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOA…- 17
- 0
Nature子刊,川大团队机器学习结合MD,预测蛋白质变构,助力药物研发
编辑 | 萝卜皮变构药物为现代药物设计提供了一条新途径。然而,识别隐蔽的变构位点是一项艰巨的挑战。四川大学蒲雪梅教授、邵振华研究员团队提出了一种先进的计算流程,结合残基驱动的混合机器学习模型(RHML)和分子动力学(MD)模拟,成功识别出了变构位点、变构调节剂,并揭示了它们的调控机制。具体而言,在 β2 肾上腺素能受体(β2AR)中,团队发现了位于残基 D79^2.50、F282^6.44、N31…- 16
- 0
AI 能「看懂」你的唇语,悄悄话不再安全
小心悄悄话被 AI 听见!(嘘)最近国外一款可以读唇语的 AI 软件火了!具体效果如下:红毯上布莱克・莱弗利小声说:“好紧张”,笑着说话时肉眼很难分辨唇语,但 AI 可以。乍一看只能看见一排白牙(bushi)的侃爷,唇语也能被轻松破解。看完后网友们开始纷纷评论,大开脑洞:求“联名”型网友:快把它和 Siri 结合一下吧!这样我就不用像小傻子一样对着电脑大喊了!测评型网友:我想用它试试“座机画质”的…- 8
- 0
比尔・盖茨用 AI 对付蚊子,助力消灭疟疾
微软创始人比尔・盖茨上周宣布,计算机视觉技术在对抗每年导致 60 多万人死亡的疟疾方面取得了重大进展。盖茨在一篇博客文章中介绍了 VectorCam,这是一款由约翰霍普金斯大学苏米亚・阿查里亚博士及其团队开发的应用程序,并得到了盖茨基金会和乌干达疟疾控制计划的支持。该应用程序可以快速识别蚊子种类,这是控制疟疾传播的关键。据AI在线了解,VectorCam 利用智能手机和廉价镜头可以在几秒钟内识别蚊…- 30
- 0
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
阿里云通义千问开源了两款语音基座模型 SenseVoice(用于语音识别)和 CosyVoice(用于语音生成)。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测,有以下特点:多语言识别:采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果;支持声音事…- 40
- 0
识别
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!