资讯列表
谷歌被曝向美国 FTC 施压:要求解除微软云对 OpenAI 技术的独家托管
据The Information援引知情人士消息称,谷歌近期已向美国联邦贸易委员会(IT之家注:简称FTC)施压,要求解除微软在其云服务器上托管OpenAI技术的独家协议。
谷歌 CEO 皮查伊嘲讽微软:他们使用的是别人开发的 AI 模型
2022 年 ChatGPT 横空出世后,微软迅速抓住机遇,向 OpenAI 注资数十亿美元。这一大胆的举动让微软可以快速接入预先开发好的 AI 模型,在竞争对手还在从零开始时,微软已经取得了显著的领先优势。然而,谷歌 CEO 桑达尔・皮查伊最近对此事进行了嘲讽。在《纽约时报》的 Dealbook 峰会上,皮查伊表示微软使用的是他人开发的 AI 模型,并乐意将谷歌和微软的模型进行对比。
OpenAI 开放 Canvas 效率神器:让 ChatGPT AI 更懂你,可执行代码、风格化写作
OpenAI 公司今天(12 月 11 日)宣布,将面向所有 ChatGPT 用户,开放 Canvas 功能,重点提升用户写作和编码项目的效率。
LLM学习原子「结构语言」,生成未知化合物的晶体结构,登Nature子刊
编辑 | 萝卜皮生成合理的晶体结构通常是预测材料化学成分及其性质的第一步,但当前大多数预测方法计算成本高,制约了创新进程。 通过使用优质生成的候选结构来预测晶体结构,可以突破这一瓶颈。 在最新的研究中,英国雷丁大学(University of Reading)的研究人员介绍了 CrystaLLM,这是一种基于晶体学信息文件 (CIF) 格式的自回归大型语言建模 (LLM) 的多功能晶体结构生成方法。
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。 Sora 终于来了! 只要是 ChatGPT Plus/Pro 用户,直接就能用上。
5分钟完成最强超算10^25年工作,谷歌量子芯片重大突破,马斯克、奥特曼齐祝贺
算力更强大,错误更少,量子计算的最大挑战之一被搞定了。 这是一个重要的里程碑。 12 月 10 日凌晨,在 OpenAI 的 Sora 吸引 AI 社区眼球的同时,谷歌宣布了一个重大突破:他们新的量子计算芯片 Willow 可通过规模扩展来降低错误率 —— 其 5 分钟就能完成超级计算机 10^25 年才能完成的计算。
NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2024年11月全球AI网站流量排行榜
AI在线 发布 2024年11月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜,并联合 哥飞的朋友们出海社群 发布出海AI网站流量排行榜!
2024年11月国内AI网站流量排行榜
AI在线 发布 2024年11月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜,并联合 哥飞的朋友们出海社群 发布出海AI网站流量排行榜!
2024年11月出海AI网站流量排行榜
AI在线 发布 2024年11月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜,并联合 哥飞的朋友们出海社群 发布出海AI网站流量排行榜!
2024年11月全球AI网站增长排行榜
AI在线 发布 2024年11月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜,并联合 哥飞的朋友们出海社群 发布出海AI网站流量排行榜!
「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D
近日,著名 AI 学者、斯坦福大学教授李飞飞团队 World Labs 推出首个【空间智能】模型,仅输入单张图片,即可生成一个逼真的 3D 世界,这被认为是迈向空间智能的第一步。 几乎同时,国内智源研究院推出了首个利用大规模无标注的互联网视频学习的 3D 生成模型 See3D---See Video, Get 3D。 不同于传统依赖相机参数(pose-condition)的 3D 生成模型,See3D 采用全新的视觉条件(visual-condition)技术,仅依赖视频中的视觉线索,生成相机方向可控且几何一致的多视角图像。
73页,开源「后训练」全流程!AI2发布高质量Tülu 3系列模型,拉平闭源差距,比肩GPT-4o mini
只进行过「预训练」的模型是没办法直接使用的,存在输出有毒、危险信息的风险,也无法有效遵循人类指令,所以通常还需要进行后训练(post-train),如「指令微调」和「从人类反馈中学习」,以使模型为各种下游用例做好准备。 早期的后训练工作主要遵循InstructGPT等模型的标准方案,如指令调整(instruction tuning)和偏好微调(preference finetuning),不过后训练仍然充满玄学,比如在提升模型编码能力的同时,可能还会削弱模型写诗或遵循指令的能力,如何获得正确的「数据组合」和「超参数」,使模型在获得新知识的同时,而不失去其通用能力,仍然很棘手。 为了解决后训练难题,各大公司都提升了后训练方法的复杂性,包括多轮训练、人工数据加合成数据、多训练算法和目标等,以同时实现专业知识和通用功能,但这类方法大多闭源,而开源模型的性能又无法满足需求,在LMSYS的ChatBotArena上,前50名模型都没有发布其训练后数据。
速度提升1000倍,效果还全面碾压!JHU等提出首个可渲染HDR场景的3DGS
常见的RGB图像大都为低动态范围(Low Dynamic Range, LDR),亮度的取值范围在[0,255]之间。 然而人眼对亮度的感知范围要比RGB图像宽广得多,一般为[0, ∞],导致LDR图像很难反映真实场景的亮度范围,使得一些较暗或者较亮的区域的细节难以被捕捉,高动态范围(High Dynamic Range,HDR)图像应运而生,具有更广的亮度范围。 新视角合成(Novel View Synthesis,NVS)任务是在给定「一个场景的几张不同视角图像,并且相机位姿已知」的情况下,合成其他新视角的场景图像。
2025年值得关注的五个AI软件开发趋势
2025 年有望成为软件开发发展的关键时刻,人工智能(AI)的不懈进步将推动这一发展。 随着 AI 继续渗透到我们生活的方方面面,它对软件开发领域的影响是不可否认的。 从自动执行日常任务到彻底改变创意过程,AI 已准备好重塑我们构建和部署软件的方式。
字节跳动豆包电脑版上线视频生成功能,内测用户每日可免费生成十支视频
字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒|Adobe&MIT新研究
AI生成视频,边生成边实时播放,再不用等了! Adobe与MIT联手推出自回归实时视频生成技术——CausVid。 思路就像从下载整部电影到直接观看流媒体的转变,在模型生成首帧画面后,视频便可以即时播放,后续内容则动态生成并无缝衔接。