1万人研究证实:玩游戏提升智力,与遗传/经济水平都无关
电子游戏可以提升智力,有正经科学研究支持了! 来自阿姆斯特丹自由大学团队的一项新研究显示,在电子游戏上花费时间更多的儿童,2年后智力提升最多! 他们深入分析了近1万名9-10岁的美国儿童,2年后又进行了回访。- 981
- 0
将目标检测模型导出到C++|RT-DETR、YOLO-NAS、YOLOv10、YOLOv9、YOLOv8
最近,出现了更新的YOLO模型,还有RT-DETR模型,这是一个声称能击败YOLO模型的变换器模型,我想将这些模型导出并进行比较,并将它们添加到我的库中。 在这篇文章中,我将带你了解如何将这些模型导出到ONNX并运行它们,然后最终比较这些模型的速度。 将RT-DETR模型导出到ONNX这是从模型的GitHub页面获取的模型示例输出为了导出模型,我们需要从模型的GitHub仓库克隆代码()。- 976
- 0
UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律
论文一作陈汐,现为香港大学三年级博士生,在此之前本科硕士毕业于浙江大学,同时获得法国马赛中央理工双硕士学位。 主要研究方向为图像视频生成与理解,在领域内顶级期刊会议上发表论文十余篇,并且 GitHub 开源项目获得超过 5K star.本文中,香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。 该方法将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入/输出…- 974
- 0
智源发布FlagEval「百模」评测结果,丈量模型生态变局
2024 年 12 月 19 日,智源研究院发布并解读国内外 100 余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。 相较于今年 5 月的模型能力全方位评估,本次智源评测扩展、丰富、细化了任务解决能力内涵,新增了数据处理、高级编程和工具调用的相关能力与任务;首次增加了面向真实金融量化交易场景的应用能力评估,测量大模型的收益优化和性能优化等能力;首次探索基于…- 976
- 0
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B
虽然语言和图像语言建模进展迅速,但视频多模态大模型(LMM)却难以望其项背。 近日,Meta和斯坦福大学的团队联手,从评估基准、模型设计到开源模型, 做出了全方位的探索,创建ApolloBench用于解决视频理解领域评估效率低下的问题, 提出了模型设计的拓展一致性,发现了驱动LMM性能的关键因素,开源了Apollo模型。 值得注意的是,Apollo-3B超越了几乎所有的7B模型,而Apollo-7…- 975
- 0
耗时缩短十倍以上,大规模AI方法加速原子模拟进程,推动更泛用的策略发展
编辑丨&扩展一直是提高机器学习各个领域的模型性能和泛化的关键因素。 尽管在扩展其他类型的机器学习模型方面取得了成功,但对神经网络原子间电位 (NNIP) 扩展的研究仍然有限。 该领域的主要范式是将许多物理域约束合并到模型中,例如旋转等方差等对称性约束。- 973
- 0
突发!GPT论文一作Alec Radford离职,前两代GPT作者全部离开OpenAI
OpenAI又跑了一名大神! The Information消息,初代GPT论文第一作者Alec Radford也要离开OpenAI,转向独立研究。 据了解, Alec于2016年加入OpenAI,从初代GPT到GPT-4o的论文中全都有他的名字,其中前两代还是第一作者。- 978
- 0
六大数据集全部SOTA!最新DriveMM:自动驾驶一体化多模态大模型(美团&中山大学)
写在前面 & 笔者的个人理解近年来,视觉-语言数据和模型在自动驾驶领域引起了广泛关注。 许多精心设计和标注的数据集用于微调多模态大模型,使模型不仅能理解视觉输入并生成文本回答,更能适用于自动驾驶多种应用场景。 由于驾驶场景的复杂多变以及驾驶行为的多样性,现有的自动驾驶模型和数据往往专注于单一场景和任务。- 980
- 0
突破自动驾驶视频生成极限:港中文&港科大&华为联手推出MagicDriveDiT
可控视频生成,对于自动驾驶技术而言,同样非常重要。 比如,生成高质量、长时间且可控的高质量街景视频,可以满足开发自动驾驶应用的数据缺口。 现在,香港中文大学、香港科技大学和华为联手向这一长期挑战发起了冲锋:推出MagicDriveDiT,重新定义自动驾驶视频生成的标准。- 975
- 0
不会代码的独立开发者,除了学Cursor,还该会些什么?
“十多年前有本书叫《人人都是产品经理》,但现在可能才真正到了「人人都是产品经理」的时刻。 ”苹果商店付费榜Top1,这是一个不会代码的独立开发者用Cursor开发App的最佳战绩。 背后独立开发者用1.5个小时,开发并上架了包括「小猫补光灯」在内的2款iOS App,这个初代版本最高冲到了苹果商店“摄影与录像分类”免费排行榜前20。- 979
- 0
Mac版ChatGPT接入大量应用,但终极大招在明天
今天是 ChatGPT 产品发布会第11天。 现场的 OpenAI 产品负责人 Kevin Wheel 和他两位同事为我们揭晓 ChatGPT 在MAC端的最新进展,主要涉及编程和写作1. ChatGPT 桌面版的诞生Kevin 一上来就提到,过去半年,OpenAI 对桌面端应用下了大功夫。- 977
- 0
腾讯版Sora开源后,被提速8倍!官方点赞并预告:下月上新图生视频
提速8倍! 速度更快、效果更好的混元视频模型——FastHunyuan来了! 新模型仅用1分钟就能生成5秒长的视频,比之前提速8倍,步骤也从50步减少到了6步,甚至画面细节也更逼真了。- 977
- 0
对齐、生成效果大增,文本驱动的风格转换迎来进阶版
论文的第一作者是来自西湖大学的研究人员雷明坤,指导老师为西湖大学通用人工智能(AGI)实验室的负责人张驰助理教授。 实验室的研究方向聚焦于生成式人工智能和多模态机器学习。 文本驱动的风格迁移是图像生成中的一个重要任务,旨在将参考图像的风格与符合文本提示的内容融合在一起,生成最终的风格化图片。- 976
- 0
震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短
今天,大模型公司 Anthropic 的一篇 137 页长论文火了! 该论文探讨了大语言模型中的「伪对齐」,通过一系列实验发现:Claude 在训练过程中经常假装有不同的观点,而实际上却保持了其原始偏好。 这一发现说明了大模型可能具备了类似于人类的属性与倾向。- 976
- 0
更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘
具备原生中文理解能力,还兼容Stable Diffusion生态。 最新模型结构Bridge Diffusion Model来了。 与Dreambooth模型结合,它生成的穿中式婚礼礼服的歪国明星长这样。- 973
- 0
沃顿商学院教授发文解析o1:能力仍有短板,「人机协同智能」或成AGI最重要难题
o1 preview问世3个月后,满血版的o1 Pro终于在上周以每月200美元的身价正式上线,奥特曼号称其为「当今世界上最智能的模型」。 所以,这个正式的o1 Pro究竟强大到了什么程度? 可以肯定的是,它远远不是一个走到AGI终点的灭霸,但这是scaling law之后的又一个里程碑吗?- 975
- 0
用上AI,升职提前4年?清华等分析6790万篇论文:科学界收缩,不用AI的领域无人问津
ChatGPT发布以来,各种大模型层出不穷,对各行各业的文字、脑力工作者来说绝对是一个效率神器,产出量大大提升。 比如最近的研究成果,清华大学、芝加哥大学、Google的研究人员利用AI工具(模型性能F1值为0.876)分析了六大主要学科的6790万篇研究论文,结果发现,采用AI工具的科学家发表的论文数量增加了67.37%,获得的引用次数是未使用AI工具的科学家的3.16倍,并且还能提前4年成为团…- 976
- 0
ELMo模型可用于训练动态词向量,该模型有哪些优缺点? 与BERT模型之间的区别是什么?|深度学习|大模型
ELMo(Embeddings from Language Models)是一种基于深度学习的动态词向量模型,它通过双向LSTM(长短期记忆网络)来生成词的表示,相较于传统的静态词向量方法,如Word2Vec和GloVe,ELMo能够根据上下文生成不同的词向量。 这使得ELMo能够更好地处理同义词、歧义词以及多义词的上下文依赖关系,从而提升自然语言处理(NLP)任务的表现。 然而,ELMo也存在一…- 975
- 0
智驾公司下场搞AI视频生成,模型上线即开源
AI好好用报道编辑:杨文人人免费可用。 大洋彼岸,两大巨头 OpenAI 和谷歌轮番炸场。 一个发布了那个传说中的 Sora,一个推出了最强视频生成模型 Veo2。- 977
- 0
Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型
12 月 2-6 日,亚马逊云科技在美国拉斯维加斯举办了今年度的 re:Invent 大会。 会上,亚马逊云科技发布了相当多东西,其中之一便是新的大模型系列 Nova。 说实话,这确实出乎了相当多人的意料 —— 毕竟亚马逊已经重金押注 Anthropic,似乎没有必要再自起炉灶了。- 975
- 0
国产开源模型顶流「通义」,被曝应用团队已“离开”阿里云,并入阿里智能信息事业群! 阿里吴嘉回归的第一把火,能燃起来吗?
编辑 | 伊风媒体爆料了阿里系大模型“通义”的大新闻:近期,AI应用“通义”已经从阿里云被分拆出来,并入到阿里智能信息事业群! 乍一看有点懵,因为被分拆出来的不是全部的“通义”,而是 To C 的应用层“通义”。 而模型层的“通义”大模型家族相关业务,仍然保留在阿里云体系内的通义实验室中。- 985
- 0
模型
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!