应用
汤姆猫:AI 语音陪伴机器人将于本月底前正式发售
汤姆猫透露,公司目前在研发的 AI 产品包括汤姆猫 AI 语音情感陪伴机器人、AI 讲故事 App、AI 游戏等系列产品。其中,汤姆猫 AI 语音陪伴机器人将于 2024 年 12 月底前正式发售。
微软 CEO 纳德拉力挺 OpenAI:在人工智能竞赛中领先两年,几乎“没有竞争对手”
据《商业内幕(Business Insider)》报道,微软首席执行官萨提亚·纳德拉最近表示,OpenAI在人工智能领域拥有两年的领先优势,使其几乎“没有竞争对手”(pretty much uncontested)。
Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强
最直接的实测例子是:当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上传后,k1 居然能识别图片中的文字,生动解读背后的物理、天文学等科学知识,从而回答用户的提问并给出清晰完整的推理思考过程。 例如,当我们上传杨振宁的手稿并向 k1 提问,k1 给出了超乎小编知识范畴所能辨真伪的答案:这是杨振宁的手稿图片——这是我们的询问:这是物理学家杨振宁的手稿照片,请你一步一步分析,杨振宁在计算什么,他可能在想什么,当时可能是什么背景? 这是 k1 的回答:上下滑动查看长图虽然小编既不懂电磁场、也不懂粒子动力学,但看完 k1 的答案着实大吃一惊!
英国测试 AI 摄像头抓酒驾:可通过驾车行为和道路使用情况判断
据BBC当地时间14日报道,英国交通管理部门正在德文郡和康沃尔郡测试一种新型摄像头,利用人工智能技术识别可能存在酒驾或毒驾行为的驾车者。
Kimi又上新!抢先实测视觉思考模型k1,甚至比o1更聪明
用强化学习,改变大模型技术范式。 国产大模型,正在引领 AI 技术新方向。 今天上午,月之暗面 Kimi 正式发布了视觉思考模型 k1,并已经上线了最新版的网页版以及安卓和 iOS APP。
谷歌 CEO 皮查伊:特斯拉和 Waymo 是自动驾驶领域前两名
在纽约时报 DealBook 峰会上,谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)高度评价特斯拉在自动驾驶领域的领先地位,并将其与 Waymo 并列为行业翘楚。
与1500多支国内外队伍同台竞技,快手在NeurIPS 2024顶级大赛中上演双杀
这几天,学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。 本届会议于今日落下帷幕,共接收 15671 篇有效论文投稿,比去年增长了 27%,最终接收率为 25.8%。 本届会议上同样值得关注的,还有一项重要的赛事,它就是「NeurIPS 2024 Auto-Bidding in Large-Scale Auctions」(大规模拍卖中的自动出价),旨在探索当前火热的强化学习、生成模型、Agent 等前沿 AI 技术在广告投放以及决策智能场景的应用。
企业大模型落地关键是什么?这家领先的大模型技术和应用公司给出答案
12 月 12 日,由中国人工智能产业发展联盟(AIIA)指导、北京中关村科金技术有限公司主办的【2024 大模型技术与应用创新论坛】在北京成功举办。 论坛现场,中关村科金总裁喻友平正式发布大模型时代的 “三级引擎战略”,推出重磅升级的得助大模型平台 2.0,以及一系列大模型应用。 其中,得助大模型平台 2.0 具备算力统一调度能力、一站式模型训推、应用快速构建三大核心能力,并基于企业级最佳实践沉淀上百个全场景套件,能够帮助各类企业快速构建和部署自己的大模型应用,显著降低企业大模型落地成本。
AI病理助手来了!浙大OmniPT上岗,3秒锁定癌症病灶,准确率超95%
病理是疾病诊断的「金标准」,而我国面临病理诊断人才严重匮乏窘境。 近年来癌症发病率不断攀升,如何借助 AI 赋能医生精准诊断,提高工作效率及医疗质量,成为当前世界病理学科的前沿热点。 近日,浙江大学发布了视觉与语言模型融合的人机交互 AI 病理万能助手 - OmniPT,该模型已在浙江大学医学院附属第一医院(以下简称「浙大一院」)病理科进行临床应用验证,病理诊断技术进入了智能化与个性化的新时代。
沟通无限,服务无界:科大讯飞携手中国银行四川省分行在天府机场应用多语种AI透明屏
四川中行创新上线科大讯飞多语种 AI 透明屏。
无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni,小巧全能,极速推理
12月16日,无问芯穹宣布正式开源其“端模型 端软件 端IP”端上智能一体化解决方案中的小模型——全球首个端侧全模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。 据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。 作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
3 个月前,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。 只用了 5 周时间,海螺 AI 的网页版访问量便增速超 800%,还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。 一时间,不少国内网友直呼其为“国产之光”。
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解
无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。
武汉大学人工智能学院成立,小米集团称期待合作
武汉大学人工智能学院今日揭牌成立,由中国科学院院士、武汉大学校长张平文教授担任首任院长。该学院将自 2025 年起在“人工智能”专业招收本科生,在“智能科学与技术”学科招收学术型硕士和博士研究生,在“电子信息”学科招收专业型硕士和博士研究生。
对话肖特特:从伯克利到PromptAI创业,发明创造下一代视觉智能
通用语言模型率先起跑,但通用视觉模型似乎迟到了一步。 究其原因,语言中蕴含大量序列信息,能做更深入的推理;而视觉模型的输入内容更加多元、复杂,输出的任务要求多种多样,需要对物体在时间、空间上的连续性有完善的感知,传统的学习方法数据量大、经济属性上也不理性...... 还没有一套统一的算法来解决计算机对空间信息的理解。
Kimi 发布视觉思考模型 k1:试题拍照给出答题思考全过程
月之暗面 Kimi 今日发布视觉思考模型 k1。该模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。
哗然!MIT教授NeurIPS演讲公开歧视中国学生,大会官方认错、本人道歉
正在加拿大温哥华举办的人工智能顶会 NeurIPS,竟然有学者在演讲中公开发表对中国学者的歧视言论。 「我这样做是为了让我的论文结果看上去更好,我的学校里没有人教我们道德或价值观。 —— 现在已被顶尖大学开除的中国留学生的借口。
高中生手机写出2.5万行代码的热门项目,GitHub 1900星,网友:给孩子捐个电脑
「强者」小孩哥:其实我是要学医的。 最近,有一个 GitHub 开源项目引发了众人的关注。 这是一个名叫 markview.nvim 的插件,作为高度定制化的 Neovim markdown 预览器,Star 量已有 1900 个。