2.0
推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛
随着语音技术在各领域应用的迅速扩展,全球语言与口音的多样性成为技术进一步突破的重大挑战。 为了应对这一难题,来自卡内基梅隆大学(CMU)、斯坦福大学(Stanford University)、乔治梅森大学(George Mason University)、台湾大学与芝加哥丰田技术学院(TTIC)的研究团队连手,在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛(Multilingual SUPERB 2.0 Challenge)。 该挑战旨在推动多语言语音技术迈向新高度,为语音科技的全球化应用奠定坚实基础。
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
浪潮信息今日发布源 2.0-M32 大模型 4bit 和 8bit 量化版,性能号称“比肩 700 亿参数的 LLaMA3 开源大模型”。4bit 量化版推理运行显存仅需 23.27GB,处理每 token 所需算力约为 1.9 GFLOPs,算力消耗仅为同等当量大模型 LLaMA3-70B 的 1/80。而 LLaMA3-70B 运行显存为 160GB,所需算力为 140GFLOPs。据浪潮信息介绍,源 2.0-M32 量化版是“源”大模型团队为进一步提高模算效率,降低大模型部署运行的计算资源要求而推出的版本,将
Midjourney 官宣网页版免费用,前谷歌大佬祭出 AI 生图 Ideogram 2.0
Midjourney 一度稳居 AI 生图的第一梯队,甚至是很多人心中的 Top1。但是 Ideogram 2.0 的发布,抢夺了 Midjourney 的荣光,不仅一举拉高了图像生成质量,还打起了价格战。曾经在 AI 图像生成领域无可匹敌的领导者 Midjourney,终于听劝了,上周五推出了网页版图像编辑器。新编辑器巧妙集成了重绘、缩放等核心功能。不仅提高了操作效率,而且使整体交互逻辑更加清晰,对于高频使用 Midjourney 的用户来说,绝对欣喜!今天,Midjourney 宣布,将升级后的新工具向所有人免
科大讯飞智文 2.0 版本发布:内置 AI PPT 编排创作引擎,基于星火大模型
AI在线从讯飞开放平台获悉,讯飞智文 2.0 版本今天正式发布,带来 PPT 文本生成大模型、AI PPT 编排创作引擎、AI PPT 在线编辑模组三大技术升级。据介绍,讯飞智文 2.0 依托讯飞星火 V4.0 的底座能力,在文本生成方面进行了独立训练,对用户输入的主题具备更强大的理解能力。用户在“主题创建”中输入一句话主题,再勾选“联网搜索”,大模型即可自动抓取实时资讯,以确保事实的时效性、准确性。▲ 图为讯飞智文 1.0 生成结果▲ 图为讯飞智文 2.0 生成结果官方表示,讯飞智文 2.0 对长文本的内容理解、
中国农业大学发布“神农大模型 2.0”:覆盖育种、种植、养殖、农业遥感及气象
第八届智慧农业创新发展国际会议于 7 月 13 日在北京举办,中国农业大学在会议上发布了“神农大模型 2.0”。AI在线注意到,相比 1.0 版本,“神农大模型 2.0”在图像、声音、视频、文件等多模态交互及智能化推理方面获得提升,使大模型能够覆盖育种、种植、养殖、农业遥感及气象等多个农业应用场景。“神农大模型 2.0”含有四个专门化的农业专业大模型:“神农・固芯”育种大模型:结合多源高维数据推理分析,优化育种流程,减少盲目性与随机性,为种子筛选与适应性评估提供科学依据,保障粮食安全“神农・筑基”种植大模型:涵盖水
金山办公发布 WPS AI 2.0:个人用户新增 4 个 AI 办公助手,政务自研模型首次亮相
感谢在今天的 2024 世界人工智能大会上,金山办公宣布升级 AI 战略,并正式发布 WPS AI 2.0。其包含 WPS AI 办公助手、WPS AI 政务版等应用,并首次公开了 13B 级别的政务自研模型 —— 金山政务办公模型 1.0。IT之家汇总 WPS AI 2.0 主要特征如下:WPS AI 2.0 为个人用户新增了 4 个 AI 办公助手,分别为 AI 写作助手、AI 阅读助手、AI 数据助手、AI 设计助手。AI 写作助手:可为用户提供“沉浸式”伴写功能,根据用户输入的内容提供智能建议,并进行续写,
手机流畅运行 470 亿大模型:上交大发布 LLM 手机推理框架 PowerInfer-2,提速 29 倍
苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而,目前在移动设备上运行的模型相对较小(苹果的是 3B,谷歌的是 2B),并且消耗大量内存,这在很大程度上限制了其应用场景。即使是苹果,目前也需要与 OpenAI 合作,通过将云端 GPT-4o 大模型嵌入到操作系统中来提供能力更强的服务。这样一来,苹果的混合方案引起了非常多关于数据隐私的讨论和争议,甚至马斯克都下场讨论。如果苹果在操作系统层面集成 OpenAI,那么苹果设备将被禁止在我的公司使用。这是不可接受的安全违规行为。既然终端侧本地部署大
首个面向气象导航的全球气象大模型,复旦大学发布“伏羲”2.0
IT之家从复旦大学官方公众号获悉,复旦大学和上海科学智能研究院昨日联合举办“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式。成立仪式上,伏羲系列气象大模型 2.0(简称“伏羲”2.0)发布,以“伏羲”2.0 为核心的智能气象创新生态联盟成立。相较于去年推出的 1.0 系列,“伏羲”2.0 的中期天气预报大模型和次季节大模型,面向新能源、航空运输等行业取得进展。“伏羲”2.0 有以下升级:面向气象导航对伏羲大模型进行优化,提高时空分辨率,实现未来 15 天 0.1 度逐小时气象预测构建海气耦合模型,纳入风浪、涌
Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品
Stability AI 近日发布新闻稿,宣布推出 Stable Audio2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。IT之家附上演示视频如下: 例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段
「天工2.0」MoE大模型发布——「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世
北京时间2月6日,昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP,体验昆仑万维「天工2.0」MoE大模型的卓越性能。「天工2.0」是昆仑万维自去年4月发布双千亿级大语言模型「天工」以来的最大规模版本升级,其采用业内顶尖的MoE专家混合模型架构,应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。此次更新全面升级了AI
千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4
10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。当天,通义千问 APP 在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 GPT-3.5,加速追赶 GPT-4。
率先开放语音、视频等多模态对话能力,这家中国公司又比OpenAI走快了一步
2023 年的 AI 领域,难以回避「大模型」这个关键词。
世界首款真开源类ChatGPT大模型Dolly 2.0,可随意修改商用
众所周知,在 ChatGPT 的问题上 OpenAI 并不 Open,从 Meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」,在人们还在因为寻找绕过限制方法的时候,主打 100% 开源的大模型来了。
支持异构图、集成GraphGym,超好用的图神经网络库PyG更新2.0版本
当前最流行和广泛使用的 GNN 库 PyG(PyTorch Geometric)现在出 2.0 版本了,新版本提供了全面的异构图支持、GraphGam 以及很多其他特性,这一系列改进,为使用者带来了更好的用户体验。
- 1