模型

计算机视觉项目实战：提升简历，精进技能
在计算机视觉领域，实践是检验理论、提升技能的试金石。无论是初学者还是希望进一步提升自己的专业人士，通过参与实际项目都是至关重要的。本文将引导您探索一系列计算机视觉项目，这些项目按照难度分类，旨在帮助您构建并展示您的专业技能。
理论
- 974
- 0
AGI12月13日
ChatGPT崩溃4小时！DDL打工人、期末大学生全慌了
今天上午8点左右，ChatGPT突然崩了。与此同时，Sora也未能幸免。简单的两行字，诛杀了多少赶DDL人的心还未修复好时候的红温状态来自故障跟踪网站DownDetector.com今天下午1点左右的时候，已经官宣完全恢复正常了！
理论
- 977
- 0
新智元12月13日
准确率达95%，混合深度学习搜索纳米生物材料，登Nature子刊
编辑 | 萝卜皮超分子肽基材料具有革新纳米技术和医学等领域的巨大潜力。然而，破译其实际应用所必需的复杂序列到组装途径仍然是一项艰巨的任务。它们的发现主要依赖于需要大量资金的经验方法，这阻碍了它们的颠覆性潜力。
理论
- 975
- 0
ScienceAI12月12日
NeurIPS 2024 | 可信大模型新挑战：噪声思维链提示下的鲁棒推理，准确率直降40%
当前，大语言模型（Large Language Model, LLM）借助上下文学习（In-context Learning）和思维链提示（Chain of Thoughts Prompting），在许多复杂推理任务上展现出了强大的能力。然而，现有研究表明，LLM 在应对噪声输入时存在明显不足：当输入的问题包含无关内容，或者遭到轻微修改时，模型极容易受到干扰，进而偏离正确的推理方向。如图 1 …
理论
- 983
- 0
机器之心12月12日
Sora之后，苹果发布视频生成大模型STIV，87亿参数一统T2V、TI2V任务
Apple MM1Team 再发新作，这次是苹果视频生成大模型，关于模型架构、训练和数据的全面报告，87 亿参数、支持多模态条件、VBench 超 PIKA，KLING，GEN-3。论文地址: Face link: 的 Sora 公布了一天之后，在一篇由多位作者署名的论文《STIV: Scalable Text and Image Conditioned Video Generation》中，苹…
理论
- 975
- 0
机器之心12月12日
反转！Claude 3.5超大杯没有训练失败，最新爆料：内部自留，用于合成数据和RL训练
传闻反转了，Claude 3.5 Opus没有训练失败。只是Anthropic训练好了，暗中压住不公开。 semianalysis分析师爆料，Claude 3.5超大杯被藏起来，只用于内部数据合成以及强化学习奖励建模。
理论
- 973
- 0
量子位12月12日
超图计算+目标检测，性能新SOTA！清华发布Hyper-YOLO：用超图捕捉高阶视觉关联
YOLO（You Only Look Once）系列是目标检测领域中的主流方法，以其高效性和实时性而著称。然而，现有的YOLO模型在处理跨层特征融合和复杂的高阶特征关系时存在局限，无法充分捕捉跨位置和跨尺度的复杂特征关联。为了解决这一难点，清华大学提出了Hyper-YOLO：一种基于超图计算的目标检测方法。
理论
- 976
- 0
新智元12月12日
OpenAI深夜被狙，谷歌Gemini 2.0掀翻牌桌！最强智能体组团击毙o1
OpenAI Day 5，风头被谷歌再一次抢了。就在刚刚，谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣：新一代原生多模态模型Gemini 2.0 Flash正式发布！至此，Gemini正式进入2.0时代！
理论
- 984
- 0
新智元12月12日
Sora/可灵/海螺/混元等大PK！多场景对比，现在谁是最强视频生成模型？
OpenAI的正式版Sora终于上线了！不过，在Sora缺席的10个月里，Runway、可灵、海螺、混元等等模型都横空出世，有的甚至都卷出了自己的特色风格和功能，比如Runway的多帧修改、可灵生成的表情更加自然、海螺的二次元风格等等。接下来我们就来一起看看，Sora和这些模型的对比效果究竟如何吧！
理论
- 975
- 0
量子位12月12日
抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩
Gemini 2.0 Flash是2.0家族第一个模型，主推原生多模态输入输出 Agent，速度比 1.5 Pro 快两倍，关键性能指标甚至超过了 1.5 Pro！支持原生工具调用、以及实时音视频流输入等新功能谷歌CEO劈柴哥，谷歌DeepMind CEO 诺奖获得者Demis Hassabis，谷歌DeepMind CTO罕见齐下场共同撰文为Gemini 2.0 Flash的推出当啦啦队重点功…
理论
- 993
- 0
AI寒武纪12月12日
物理诺奖得主最新演讲，Hinton带伤飞到瑞典，LSTM之父：都是剽窃
2024年诺贝尔物理学奖的两位获奖者John Hopfield和Geoffrey Hinton最近在斯德哥尔摩大学发表了最新的演讲。现场的氛围非常热烈！看到Hopfield教授即使借助拐杖也亲自到达现场发表了演讲，Hinton教授也忍着腰痛专程飞到瑞典，让观众们非常敬佩。
理论
- 979
- 0
量子位12月11日
AI视频边生成边播放！首帧延迟仅1.3秒，生成速度9.4帧/秒｜Adobe&MIT新研究
AI生成视频，边生成边实时播放，再不用等了！ Adobe与MIT联手推出自回归实时视频生成技术——CausVid。思路就像从下载整部电影到直接观看流媒体的转变，在模型生成首帧画面后，视频便可以即时播放，后续内容则动态生成并无缝衔接。
理论
- 978
- 0
量子位12月10日
看3.2亿帧视频学会3D生成，智源开源See3D：只需单图即可生成3D场景
近日，著名AI学者、斯坦福大学教授李飞飞团队WorldLabs推出首个「空间智能」模型，仅输入单张图片，即可生成一个逼真的3D世界，这被认为是迈向空间智能的第一步。几乎同时，国内智源研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D—See Video, Get 3D。 △See3D支持从文本、单视图和稀疏视图到3D的生成，同时还可支持3D编辑与高斯渲染不同于传统依赖相机参…
理论
- 982
- 0
量子位12月10日
谷歌量子芯片引爆热议：5分钟算完10²⁵年任务，Nature加急发表，还证实了多元宇宙？？？
全球科技圈都在为Sora疯狂，马斯克却轻轻给谷歌点了个赞（doge）。就在OpenAI“双12”第三天，谷歌在前沿科技的另一极出手了：发布最新量子芯片，5分钟内完成当今最快超级计算机之一需要10²⁵年才能完成的计算！怎么说1025这事儿呢，就是……10000000000000000000000000，10亿亿亿年。
理论
- 979
- 0
量子位12月10日
Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE
消失的Aurora再度回归了！刚刚，xAI发布了首款完全自研图像生成模型Aurora，直接集成到了Grok当中。整个研发过程，耗时6个月。
理论
- 976
- 0
新智元12月10日
刚刚，OpenAI Sora正式炸裂登场，网页挤爆了！
OpenAI 12 天连更的第三个工作日，重磅发布终于来了！正如直播之前大家在评论区预想的一样，视频生成大模型 Sora 正式版终于露面！算起来，距离今年 2 月 16 日 Sora 的发布已经过去了近 10 个月的时间。
理论
- 986
- 0
机器之心12月10日
AI 视频生成王者 Sora 上线：OpenAI 的“魔法棒”，1080P@20 秒具象化你的想象力
OpenAI 公司昨日（12 月 9 日）发布博文，宣布正式推出 Sora 文生视频 AI 模型，邀请 ChatGPT Plus 和 ChatGPT Pro 用户，通过访问 sora.com 网站，生成最高分辨率 1080p、时长达 20 秒的视频，并支持宽屏、竖屏和方形比例。
应用
- 981
- 0
故渊12月10日
大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！清华刘知远团队发现：大模型能力密度约100天翻倍！
整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Scaling Law会失效吗？虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。但是，OpenAI的最近的发布也没有那么炸了，尤其是 o1 Pro 比满血版在编程能力上仅高出一分，似乎更让人相信了“墙”的存在。
理论
- 980
- 0
伊风12月9日
首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术报告，端到端VLA模型驱动，唱跳都能陪你玩
世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了！ AI角色扮演类游戏（如C.AI、Talkie）从发布以来，一直都是人们最喜欢的AI产品之一。虽然广受欢迎，但不少用户提出，期待和这些角色在VR中有更进一步的交流。
理论
- 979
- 0
新智元12月9日
o1 pro挑战美国本科生最难数学竞赛，30分钟交卷却被「大佬」现场打脸！
一年一次的北美最难本科数学竞赛，刚在MIT沃克纪念堂（Walker Memorial）落幕。这场普特南数学竞赛（Putnam Exam），每年汇聚了来自北美数百所高校的3500多名学生前来参赛。既有个体，也有团体，他们需要在总时长为6小时的时间内完成作答。
理论
- 984
- 0
新智元12月9日
马斯克新文生图模型闪现！网友抢时间疯狂实测：人物生成超逼真，可算把赛博皮卡画明白了
马斯克xAI的一个新动作，着实是引发了不少网友们的猎奇心理。事情是这样的。就在这个周末，xAI在自家的Grok里上线了一个新的文生图模型，名叫Aurora。
理论
- 973
- 0
量子位12月9日
严禁AI评审！CVPR 2025重申大模型审稿0容忍，一首拒稿小诗爆笑全场
CVPR的投稿量每年都在刷新纪录，总以为今年是巅峰，但明年只会更多。 CVPR 2024收到11532次提交，增幅达到了26%；今年的投稿增速虽然有所放缓，达到13%，但也超过了13000次提交。投稿量过大，最直接导致的一个问题就是「高质量审稿人不足」，很多人为了简化审稿流程，可能会选择用大模型进行审稿。
理论
- 977
- 0
新智元12月9日
从零开始学机器学习—分类器详解
首先给大家介绍一个很好用的学习地址：，利用多种分类器对这些数据进行训练，以构建有效的模型。在这个过程中，我会详细讲解每一种分类器的原理及其重要性。尽管这些知识点对于实践来说并不是必须掌握的，因为第三方依赖包已经为我们完成了大量的封装，使得调用这些功能仅需一行代码，但理解其背后的原理仍然至关重要。
理论
- 975
- 0
努力的小雨12月9日
OpenAI的12天王炸计划：技术狂欢还是资本闹剧？
大家好，我是下李哥。最近硅谷又炸锅了！ OpenAI这波操作，简直是要把全网AI玩家都整得神经兮兮的。
理论
- 977
- 0
小李哥编程12月9日