资讯列表

端侧最强开源 AI 模型 Llama 3.2 登场:可在手机运行,从 1B 纯文本到 90B 多模态,挑战 OpenAI 4o mini

Meta 公司昨日(9 月 25 日)发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs (11B 和 90B),以及轻量级纯文本模型(1B 和 3B),此外提供预训练和指令微调(instruction-tuned)版本。AI在线附

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

刚刚,字节的火山引擎的发布会基本结束了。 我现在有点过于激动。 虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。 字节正式发布了他们全新的两款 AI 视频模型: 豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。 他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。 真的,如果要给这个豆包 PixelDance

惠普报告称生成式 AI 正被用于创建网络攻击恶意软件,可被藏匿在 svg 图像中

当地时间 24 日,惠普发布的《威胁洞察(Threat Insights)》报告指出,不良行为者、黑客和网络犯罪分子正在利用生成式 AI 开发复杂的恶意软件,目标是法语用户。“恶意软件的结构、解释每行代码的注释以及母语函数名和变量都表明,威胁行为者使用生成式 AI 创建了该恶意软件。”受害者通常通过网络钓鱼电子邮件或恶意广告成为攻击目标,从而进入恶意网站。这些网站看似专业可信,通常提供假冒的工具或服务,例如 PDF 转换器。但是,这个 ChromeLoader 活动在用户被引向假冒 PDF 工具后,最终安装了恶意代

华章廿载 新质未来 ——2024第二十届全国高性能计算学术年会在武汉成功举行

“九省通衢达天下,超算之光耀楚天”,9月24日至26日,第20届CCF全国高性能计算学术年会(CCF HPC China 2024)在武汉市中国光谷科技会展中心盛大举行。 大会由中国计算机学会主办,中国计算机学会高性能计算专业委员会、华中科技大学、上海交通大学承办,中国地质大学(武汉)、北京并行科技股份有限公司协办。 以“华章廿载 新质未来”为主题,本届大会由12位院士领衔,携手来自算力领域的400多位顶尖学者,进行学术交流和专题分享。

李彦宏数千万元投资大模型创业公司 鼓励创业者坚持长期主义

李彦宏表示,智能体最明显的特点是门槛足够低,谁都能上手,但同时天花板又足够高,可以做出非常复杂,非常强大的应用。 未来,将会有数以百万量级的智能体出现,形成庞大的智能体生态。 值得一提的是,在今年文心杯创业大赛中,有超过60%参赛团队聚焦智能体的应用,超过30%参赛团队没有专业程序员。

百度全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0

感谢2024 百度云智大会今日在北京召开,百度在大会上宣布全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0 两大 AI 基础设施,并升级代码助手、智能客服、数字人三大 AI 原生应用产品。百度智能云事业群总裁沈抖表示:“2024 年大模型的产业落地正在加速,目前在千帆大模型平台上,文心大模型日均调用量超过 7 亿次,累计帮助用户精调了 3 万个大模型,开发出 70 多万个企业级应用。过去一年,文心旗舰大模型降价幅度超过 90%,主力模型全面免费。”升级百舸 4.0为满足企业落地大模型从集群创建、开发

百度李彦宏:智能体是我最看好的 AI 应用方向

在今日的 2024 百度云智大会上,“文心杯”创业大赛第二季结果揭晓。百度创始人李彦宏发表颁奖致辞时指出,智能体是他最看好的 AI 原生应用发展方向,相当于 PC 时代的网站和自媒体时代的账号。李彦宏表示,智能体最明显的特点是门槛足够低,谁都能上手,但同时天花板又足够高,可以做出非常复杂,非常强大的应用。未来,将会有数以百万量级的智能体出现,形成庞大的智能体生态。AI在线注意到,在今年文心杯创业大赛中,有超过 60% 参赛团队聚焦智能体的应用,超过 30% 参赛团队没有专业程序员。“百度希望能与所有的创业领域企业共

“稚晖君”创业项目,智元自主研发的机器人中间件 AimRT 开源

智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示,AimRT 是一个更现代、轻量易用,且高效稳定的通信开发框架,具备机器人开发流程所必备的许多实用特性,并解决了主流开源中间件的一些痛点:在软件开发效率方面,AimRT 基于现代 C 新标准开发,轻量易部署,将现代化设计模式应用在资源管控、异步编程、部署配置等方面,使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面,AimRT 提供了完善的调试、性能分析工具,以及良好的可观测性支持,有助于快速发现并解决系统中的问题,相比较传

星纪魅族正在开发星纪战车、机器人等新品

星纪魅族 AI 生态发布会于今日下午举行,在发布会尾声,星纪魅族预热了两款正在研发的新品 —— 星纪战车、机器人。从图中可以看到,星纪战车采用剪刀门设计,整体底盘很高;机器人是人形机器人风格,整体造型犀利,目前尚不清楚是概念图还是实物设计图。据AI在线此前报道,星纪魅族今日还公布了自己的智能生态产品体系:将基于 FlymeAIOS 技术底座,以 Star 和魅族两大品牌承载 AI 终端落地体验。星纪魅族 AI 生态发布会专题

Nature子刊,川大团队机器学习结合MD,预测蛋白质变构,助力药物研发

编辑 | 萝卜皮变构药物为现代药物设计提供了一条新途径。然而,识别隐蔽的变构位点是一项艰巨的挑战。四川大学蒲雪梅教授、邵振华研究员团队提出了一种先进的计算流程,结合残基驱动的混合机器学习模型(RHML)和分子动力学(MD)模拟,成功识别出了变构位点、变构调节剂,并揭示了它们的调控机制。具体而言,在 β2 肾上腺素能受体(β2AR)中,团队发现了位于残基 D79^2.50、F282^6.44、N318^7.45和S319^7.46 附近的一个新的变构位点及潜在调节剂 ZINC5042。通过分子力学/广义 Born 表

微软发布新工具,检测和纠正 AI 幻觉内容

科技媒体 The Decoder 昨日(9 月 24 日)发布博文,报道称微软以预览版的形式,在 Azure AI Content Safety 中推出 Groundedness Detection,用于“纠正” AI 幻觉。AI 幻觉在人工智能领域中,幻觉是由人工智能生成的一种回应,它含有貌似事实的虚假或误导性资讯。该术语源自幻觉的心理学概念,因为它们具有相似的特征。人工智能幻觉的危险之处之一是模型的输出看起来是正确的,而它实际上是错误的。Groundedness Detection微软的 Groundednes

当大模型Scaling Law继续,万卡集群算力释放在「百舸」这里找到一条通途

在电影《天下无贼》中,葛优扮演的黎叔有这样一句经典的台词,「二十一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。随着模型规模急剧扩张,参数已经飙升到了千亿甚至万亿级,业界开启了千模大战,AI 算力需求不可避免迎来爆炸式增长,无论是前期训练还是后期推理,都是如此。在训练层面,OpenAI 曾在 2018 年做过估算,自 2012 年以来,AI 模型训练算力需求每 3.5 个月翻一番,每年所需算力增幅高达 10 倍,增速远远超出了芯片产业长期存在的摩尔定律(性能每 18 个

终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」

这项高级语音功能,大家可是等了好久。谷歌又被 OpenAI 截胡了。前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。「高级语音功能今天推出!(将在本周内完成),希望您的等待值得。」奥特曼表示道,最后还不忘加一个委屈、小桃心的表情。这次,OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了,因为 OpenAI 暂时没有这个计划。据了解,Plus 用户每月需支付

文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!

在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式多样,其内容质量亦呈现出显著的差异性。对海量数据进行精细化的清洗与预处理工作,已成为提升数据价值、确保模型精准高效的关键一环,如何有效提取并利用这些宝贵的知识资源,成为了摆在所有企业面前的一道难题。9 月 20 日,老牌数字化转型技术服务提供商浩鲸科技在云栖大会期间,成功举行鲸智大模型技术体系发布会,作为企业内部的 “资

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]该论文的第一作者及指导作者均来自德克萨斯大学达拉斯分校,第一作者为博士生 Ruochen Li,指导作者为其博士生导师 Xinya Du,专注于自然语言处理、深度学习和大语言模型的研究。X

英伟达发布 Llama-3.1-Nemotron-51B AI 模型:创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型,共有 510 亿参数。该 AI 模型主要采用了神经架构搜索(NAS)技术微调,平衡性能和效率,在高工作负

OpenAI o1 AI 模型 PlanBench 规划能力实测:准确率 97.8%,远超 LLaMA 3.1 405B 创造的 62.6% 纪录

来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA

谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快

科技媒体 The Decoder 昨日(9 月 24 日)发布博文,报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模型的速率限制,并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内