语言

视觉模型进入MoE时代！DeepSeek开源全新视觉模型VL2，逆向由图生成代码、梗图解析、几张图生成一篇童话！
编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）12月13日晚，国内开源模型玩家深度求索发布了视觉模型 DeepSeek-VL2。这次DeepSeek视觉模型给这一领域带来了不少看新看点：1、模型层面，视觉模型也可以使用 MoE 架构，而且可以配合动态切图2、新增了不少生成玩法，如：视觉定位，模型可以根据提示识别出物体的边界范围，再比如梗图理解和解析。 3、图表理解：可以根…
理论
- 976
- 0
言征12月17日
腾讯出手了！开源最大AI视频模型，130亿参数，性能媲美闭源，击败Runway Gen-3、Luma 1.6
编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）AI视频领域持续不断有新玩家入局！ 12月3日，腾讯出手了，不仅在元宝APP里上线AI视频功能，还直接开源了混元视频模型！图片（打开元宝APP，若没有找到入口的话，可以检查是否更新到了最新版本，目前可能会有排队时间。
理论
- 972
- 0
伊风12月4日
史上最严“中文真实性评估”：OpenAI o1第1豆包第2，其它全部不及格
新的大语言模型（LLM）评估基准对于跟上大语言模型的快速发展至关重要。近日，淘宝天猫集团的研究者们提出了中文简短问答（Chinese SimpleQA），这是首个全面的中文基准，具有“中文、多样性、高质量、静态、易于评估”五个特性，用于评估语言模型回答简短问题的真实性能力。研究人员表示，中文简短问答能够指导开发者更好地理解其模型的中文真实性能力，并促进基础模型的发展。
理论
- 972
- 0
admin11月21日
深度解析Recraft V3：突破文本渲染限制，「文生图」黑马是怎样炼成的？
在当前的图像生成技术中，文本渲染的能力已逐渐成为衡量其先进性的重要标准。不论是学术界的最新研究还是市场上的先进产品，都在竞相展示其处理复杂文本的能力，这不仅标志着技术的进步，更是成为一种创新的分水岭。实际上，字图生成技术在多个领域内显示出显著的实用性，例如在设计海报、书籍封面、广告和LOGO等方面，已成为不可或缺的工具。
理论
- 971
- 0
新智元11月14日
大语言模型时代，提示词才是王道：堪比专业翻译软件的提示词
先给大家看看最终效果：商人罗伯特·洛卡西奥，开了个名叫EqualAI的非营利组织，专门应对人工智能开发中那些看不见、摸不着的无意识偏见。这名字听起来倒是光鲜，然而，他却在《Fast Company》上发了一篇文章，讲的是什么“提示工程”的局限。事情的由头不过是一个普普通通的提示语：“写篇750字的文章，说说人工智能怎么成了品牌的‘数字门面’，要写得像《Fast Company》的文章那样。
理论
- 973
- 0
rocLv11月4日
科大讯飞语音识别首次实现全国地级市方言全覆盖，星火大模型首次支持 9 种外语
在今日上午的 2024 科大讯飞全球 1024 开发者节上，科大讯飞宣布语音识别首次实现全国地级市方言全覆盖，支持包括 288 个地市的 202 种方言。在发布会上，科大讯飞首次发布星火多语言大模型，支持英语、俄语、日语、阿语、韩语、法语、西语、葡语、德语共 9 种外语。科大讯飞还展示了星火多语言大模型的多个使用场景，包括车载语音交互的任务推荐、意图理解、实时检索等，AI在线附图如下：星火多语…
应用
- 21
- 0
汪淼10月24日
阿里国际 Marco 翻译大模型发布：支持中英日韩西法等 15 种主流语言
感谢据阿里国际 AI 团队 AIDC-AI，阿里国际最新研发的翻译大模型 Marco 于今日正式上线，支持中、英、日、韩、西、法等 15 种全球主流语种。官方称其基于目前广泛使用的开源评测数据集 Flores，Marco 翻译大模型在 BLEU 自动评测指标上，领先于市面上的标杆翻译产品，如 Google 翻译、DeepL、GPT-4 等。“你的宝贝正在路上”，不会再被翻译成“Your baby …
应用
- 19
- 0
清源10月16日
OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文
科技媒体 marktechpost 昨日（9 月 23 日）发布博文，报道称 OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI 决定推出 MMMLU 数据集，通过提供强大的多语言和多任务数据集，来评估大型语言模型（LLMs）在各种任务中的性能，从而应对这…
应用
- 6
- 0
故渊9月24日
谷歌宣布为全球 AI 教育设立 1.2 亿美元基金
谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）于当地时间 9 月 21 日在联合国未来峰会上发表讲话，将 AI 描述为“迄今为止最具变革性的技术”。皮查伊表示，谷歌正在研究迄今为止最具变革性的技术 —— 人工智能，谷歌还看到了四个最大机遇，其中许多机遇与可持续发展目标相一致：一是帮助人们用自己的语言获取世界信息和知识。仅去年一年，谷歌就利用人工智能在 Google 翻译中添加了 110…
应用
- 4
- 0
汪淼9月23日
顺丰发布“丰语”大语言模型：摘要准确率超 95%，号称物流垂域能力超越通用模型
顺丰科技昨日在深圳国际人工智能展上发布了物流行业的垂直领域大语言模型“丰语”。顺丰科技大模型技术总监江生沛表示，顺丰在综合考虑效果与使用成本的均衡的思路下，自研了行业的垂直领域大语言模型。在训练数据方面，丰语约有 20% 的训练数据是顺丰和行业的物流供应链相关的垂域数据。AI在线获悉，目前基于大模型的摘要准确率已超过 95%，客服人员与客户对话后的处理平均时长减少了 30%；对快递小哥问题的定位准…
应用
- 34
- 0
沛霖（实习）9月9日
ACL 2024 大奖揭晓！全华人团队用 AI 破解 3000 年前甲骨文密码
一年一度 NLP （自然语言处理）顶会 ACL （国际计算语言学协会）揭晓了最终获奖论文。今年，共有 7 篇论文荣获最佳论文，时间检验奖颁给斯坦福 GloVe、康奈尔大学相似性度量。另外，还有最佳主题奖、最佳社会影响力奖、最佳资源奖、领域主席奖，以及杰出论文奖。ACL 2024 终于颁奖了！共有 7 篇最佳论文，35 篇杰出论文，还有时间检验奖、SAC 奖、最佳主题论文、最佳资源论文奖等一并公布。…
应用
- 38
- 0
清源8月15日
Qwen2-Math 开源 AI 模型发布：阿里通义千问家族新成员，数学能力超 GPT-4o
感谢阿里通义千问 Qwen2 开源家族迎来新成员 Qwen2-Math，共有 15 亿参数、70 亿参数和 720 亿参数三个版本，是基于 Qwen2 LLM 构建、专门用于数学解题的语言模型。简介Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型，其数学能力显著超越了开源模型，甚至超过了闭源模型（如 GPT-4o），官方希望为科学界解决需要复杂多步逻辑推理的…
应用
- 47
- 0
故渊8月9日
专治 AI 大模型对错误答案“过于自信”，麻省理工学院提出新型高效低耗校准方法
人们正在越来越多地使用大模型完成各种任务，不论是翻译、总结文章还是识别金融诈骗，大模型都是“无所不包”。尽管这些模型都具有“惊人”能力，但它们偶尔也会生成错误答案，并对错误答案过于自信、对正确答案信心不足，使用户对大模型是否值得信任表示怀疑。据 MIT NEWS 今日报道，麻省理工学院（MIT）和 MIT-IBM Watson AI Lab 的研究人员提出了一种专为大型语言模型量身定制的校准方法。…
应用
- 8
- 0
清源7月31日
DeepL 推出新一代翻译编辑大型语言模型：译文受青睐度达 ChatGPT-4 的 1.7 倍
以其同名机器翻译器闻名的语言人工智能公司 DeepL 德国当地时间昨日宣布推出新一代面向翻译和编辑应用的大型语言模型。DeepL 宣称基于新模型的译文受语言专家的青睐程度是谷歌翻译的 1.3 倍，ChatGPT-4 的 1.7 倍，微软翻译的 2.3 倍。DeepL 的新模型基于这家企业在过去七年中积累的训练语料，采用先进大型语言模型技术，并获得了数千名语言专家的“辅导”，专为内容创建和翻译打造。…
应用
- 13
- 0
溯波（实习）7月18日
大脑如何处理语言？普林斯顿团队对Transformer模型进行分析
编辑 | 萝卜皮在处理语言时，大脑会部署专门的计算来从复杂的语言结构中构建含义。基于 Transformer 架构的人工神经网络是自然语言处理的重要工具。普林斯顿大学的研究人员探讨了 Transformer 模型和人类大脑在语言处理中的功能特殊化问题。Transformer 通过结构化电路计算整合单词间的上下文信息。不过，当前的研究主要集中于这些电路生成的内部表征（「嵌入」）。研究人员直接分析电路…
理论
- 8
- 0
ScienceAI7月17日
阿里云通义千问开源两款语音基座模型，识别效果优于 OpenAI Whisper
阿里云通义千问开源了两款语音基座模型 SenseVoice（用于语音识别）和 CosyVoice（用于语音生成）。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测，有以下特点：多语言识别：采用超过 40 万小时数据训练，支持超过 50 种语言，识别效果上优于 Whisper 模型富文本识别：具备优秀的情感识别，能够在测试数据上达到和超过目前最佳情感识别模型的效果；支持声音事…
应用
- 40
- 0
沛霖（实习）7月9日
美加州大学团队发明自供电贴片，借助机械进修可使聋哑人“语言”
据外媒 NotebookCheck 今日报导，美国加州大学洛杉矶分校生物工程师近日发明了一种新型自供电贴片，可借助机械进修技术，将喉部肌肉静止等转化为语言的声音。据悉，这种可穿戴贴片可让声带损伤、疾病而导致丧失语言能力或无法正常语言的人“语言”。该粘合贴片可感知喉部肌肉静止，贴片的外层是聚二甲基硅氧烷（PDMS），中间夹着两层铜线圈作为磁感应（MI）层，两层铜线圈被单层聚二甲基硅氧烷和磁铁作为磁机…
AI
- 3
- 0
清源3月30日