视觉说话模型导论:这篇论文能成为你进军VLM的第一步
近些年,说话建模范围进展非凡。Llama 或 ChatGPT 等许多大型说话模型(LLM)有才智解决多种不同的使命,它们也正在成为越来越常用的工具。这些模型之前基本都局限于文本输入,但现在也正在具备处理视觉输入的才智。如果能将视觉与说话打通,那么势必能造就多种多样的应用 —— 这实际上也正是当前 AI 技术革命的关键方向。即便现在已有不少研究将大型说话模型扩展到了视觉范围,但视觉与说话之间的连接尚…- 25
- 0
科大讯飞:讯飞星火 V4.0 在训练中,对标 GPT-4o 的产物也在研发
科大讯飞在“深交所互动易”平台回复网友发问时流露,对标 GPT-4 当前才智的讯飞星火 V4.0 在训练中,预计在 2024 年 6 月底公布,对标 GPT-4o 的产物在研发中。科大讯飞方面示意,公司将紧密结合人工智能的演进和突破,把成果持续应用到智慧教育的每个产物中,不断提升产物的用户体验和客户渗透率。而在本年 4 月,科大讯飞董事长刘庆峰曾流露,本年 6 月 27 日,讯飞星火 V4.0 将…- 7
- 0
AI 赋能剪贴板:微软 PowerToys 新增“初级粘贴”性能
微软正为 PowerToys 加入一项名为“初级粘贴”的新性能,其利用人工智能的强大性能,可以实时变换剪贴板内容。这项新性能能够帮助用户提升工作效率,例如将一种编程谈话的代码复制粘贴成另一种谈话的代码。不过,要利用初级粘贴性能的一些更初级特性,必要 OpenAI API。“初级粘贴”包含在 PowerToys 0.81 版本中,启动后可以通过组合键 Windows 键 Shift V 调出。这会打…- 14
- 0
AI在用 | 原来,360 AI浏览器还能轻松编纂长视频
编纂:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。视频为王。不过,和视频生成领域的精彩纷呈相比,剪辑战场总差那么一口气。就拿长视频剪辑来说,费时费力,趁手的 A…- 28
- 0
讯飞星火 Lite API 威力免费开放:在线联网搜索、低算力推理场景
感谢科大讯飞今日官宣,旗下讯飞星火 Lite API 永久免费开放,支持在线联网搜索、适用于低算力推理与模型精调等定制化场景。IT之家注:讯飞星火 Pro / Max API 价格为:0.21 元 / 万 tokens。据介绍,1token 相当于 1.5 个中文汉字,用户付费 0.21 元即可调用“讯飞星火 3.5 Max”生成一部“余华《活着》”的内容量。讯飞星火大模型 V3.5 发布于今年 …- 36
- 0
Meta 首发「变色龙」挑战 GPT-4o,34B 参数引领多模态革命!10 万亿 token 训练刷新 SOTA
【新智元导读】GPT-4o 发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta 团队发布了「混杂模态」Chameleon,可以在单一神经网络无缝处理文本和图象。10 万亿 token 训练的 34B 参数模型本能接近 GPT-4V,刷新 SOTA。GPT-4o 的横空出世,再次创立了一个多模态模型发展的新范式!为什么这么说?OpenAI 将其称为「首个『原生』多模态」模型,意味着 GPT-…- 8
- 0
讯飞星火大模型 V3.5 春季上新,V4.0 官宣 6 月 27 日宣布
感谢科大讯飞今日官宣,讯飞星火大模型 V3.5 春季上新,科大讯飞董事长刘庆峰宣布讯飞星火大模型一系列新功能。刘庆峰表示,目前星火大模型通用长文本能力,包括长文档信息抽取、长文档学问问答、长文档归纳归纳、长文档文本生成等,总体已经达到 GPT-4 Turbo 今年 4 月最新长文本版本的 97% 的水平,而在多个垂直领域的学问问答任务上,星火大模型长文本总体水平已经超过 GPT-4 Turbo。讯…- 6
- 0
360 智脑 7B 参数大模型开源,支持 50 万字长文本输入
感谢360 公司日前在 GitHub 上开源了 360 智脑 7B(70 亿参数模型)。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练,以华文、英文、代码为主,开放 4K、32K、360K 三种不同文本长度。360 表示,360K(约 50 万字)是当前国产开源模型文本长度最长的。360 表示,他们在 OpenCompass 的主流评测数据集上验证了模型性能,包括 C-Eval、…- 4
- 0
周鸿祎自称“开源信徒”:发布将开源 360 智脑 7B 模型,撑持 50 万字长文本输入
感谢360 创始人周鸿祎近日透露即将开源 360 智脑 7B(70 亿参数模型),撑持 360k(50 万字)长文本输入。周鸿祎表示,前段时间大模型行业卷文本长度,100 万字“很快将是标配”。“我们打算将这个威力开源,大家没必要重复造轮子,定为 360k 主要是为了讨个口彩。”他还自称“开源的信徒”,信奉开源的力量。据介绍,360 智脑长文本威力已入驻大模型产品“360AI 浏览器”。周鸿祎还谈…- 6
- 0
来自一线大咖的前沿观察与洞见,大模型手艺 Workshop 第一期运动举行
为了更好地分享大模型手艺最新进展,张江科投、张江孵化器、机器之心、WAIC Circle 联合发起举办了“大模型手艺 Workshop”系列运动,邀请产学研一线大咖带来前沿观察与洞见。3月22日,大模型手艺 Workshop 第一期成功举行。本次运动环抱“Claude 3热浪来袭,一起聊聊文本大模型的重点手艺路径”开展,并得到了张江科学城商会的大力支持。张江孵化器总经理金红梅张江孵化器总经理金红梅…- 22
- 0
WorldGPT来了:打造类Sora视频AI智能体,「复活」图文
前Meta首席工程负责人胡鲁辉带领Seeking AI携手哈佛、斯坦福、北大等知名学府推出WorldGPT,实现静态内容与动态视频的高度融合- 14
- 0
全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!
元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型利用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。全球主流长文本大模型图谱 参数量和高质量数据量决定了大模型的计算复杂度,而长文本技能(Long Context)是大模型利用发展“杀手锏”,因技能新、研发…- 6
- 0
从“源头”庇护数据危险:腾讯危险推出大模型隐衷庇护脱敏技巧
大模型已经被广泛运用在各类场景,帮助人们从事报告纲要、文本翻译、数据分析、业务风控等各项工作,极大地提升了工作效率,但同时公众对于大模型带来的数据泄漏的隐忧也从未停止。近日,腾讯危险玄武实验室披露了一项关于大模型隐衷庇护的危险脱敏与复原(Hide and Seek, HaS)技巧,有望帮助大模型产品运用者从内陆终端侧防范隐衷数据泄漏。HaS为业内首个支持信息复原的自在文本脱敏技巧,通过对用户上传给…- 6
- 0
腾讯OCR团队斩获ICDAR大赛四项冠军
在全球文字辨别(OCR)领域顶级盛会ICDAR 2023上,腾讯OCR团队基于自研算法,斩获四项冠军,这是继2017年、2019年、2021年以来,连续四届参会同时创造佳绩,共获得18项官方认证冠军,展示了腾讯OCR技术在全球的一流水平。ICDAR大会是全球文档图象分析辨别领域公认的权威学术会议,每两年举办一次,赛事举办至今已经吸引了超过100多个国家的近8000支队伍参与其中。ICDAR竞争因其…- 7
- 0
两行代码解决大说话模型对话局限! 港中文贾佳亚团队联合MIT发布超长文本扩展技能
代码和Demo地址::、模型偷懒、上下文越长大模型越笨......如果体验过大说话模型产品,用户多少会对文本输入长度带来的限制有所感触,比如当想和大模型讨论一些稍长的内容,需要拆分输入,而前面输入的要点,很快就会被大模型忘记。这是典型的大说话模型对话缺欠!就像先天有注意力缺欠的儿童,难以专注看完一本新书。而缺欠的关键,在于模型缺乏长文本处理能力。这个局面如今被打破。近日,贾佳亚团队联合MIT发布的…- 5
- 0
还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!
机械之能报道编辑:吴昕还记得一周前我们介绍过的那个文生图东西吗?对,让马斯克「穿越」,变身古风大侠的那个。也是让 Blackpink Jennie 「变胖」的那个:当时, Ideogram 官宣成立并公开了测试版 v0.1 。机械之能赶紧排队注册,试用了一下。据说,短短一周内,积累了超过 90,000 名用户,生成了超过 300 万张图象!今天, Ideogram 进一步宣布向地球上的每个人开放 …- 9
- 0
图文实录|澜舟科技合伙人李京梅:鉴于预训练模型的 AIGC 手艺与运用实践
在 AIGC 范畴,人类应该持续提升创造力,不要停止,不要因为有了 AI 就不去创造了,而 AI 也将通过提升整个产业效率的方式来帮助人类更好地创造价值。- 7
- 0
多模态文档LayoutLM版面智能明白技术演进-纪传俊
LayoutLM经过从1.0到3.0版本的迭代,不断优化模型,可见多模态技术对于文档明白的可行性和未来巨大的潜力未读抱拳拒绝赞感谢找文档图片文件@消息更多酷应用- 23
- 0
澜舟科技推出「熊猫小说家」小程序,用 AI 书写你的小说
普罗佩提乌斯说过:“我之所以写作并不是由于天才的冲动,而是为了舒缓爱情的烦恼和哀诉人生难以消除的痛苦。”每当被优秀小说中那些天马行空的想象、感人至深的对白、百转千回的情节所触动时,你是否有想过如果可以将自己的生活写成小说,那会是一部怎样的作品?如果把我的日常生活用玄幻世界的语言来描述,小说中会有什么好玩的事情发生?如果我和同伙们一起进入了仙侠世界,我们会经历什么样的剧情?你的这些脑洞在澜舟科技全新…- 20
- 0
文本
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!