豆包
豆包App更新实时语音通话功能,中文对话断崖式领先,人机难辨!
1月20日,豆包APP更新实时语音通话功能,面向所有用户开放。 该功能基于最新豆包实时语音大模型(Doubao Realtime Voice Model)。 更新后,豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果,可以模仿不同声线,并且在“逻辑思考”和“情绪感知”上有明显提升。
豆包推出实时语音大模型:号称中文对话断崖式领先、情商智商均在线
据介绍,豆包实时语音大模型实现了语音理解和生成一体化,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
字节跳动豆包全新上线 AI 编程功能:支持一键上传多个本地代码文件、实时引入 GitHub 开源仓库
豆包官方公众号显示,豆包电脑版和网页版全新上线AI编程功能。该功能支持一键上传多个本地代码文件、实时引入GitHub开源仓库,快速获取项目的完整上下文,不需再逐段复制代码。
豆包大模型发布各领域技术进展,首次披露 300 万长文本能力
字节跳动旗下豆包大模型今日对外公布了2024年全领域的技术进展,宣称自5月15日首次亮相的7个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。
联想与火山引擎官宣合作,为AI桌面助手接入豆包大模型
12月26日,在2024联想天禧生态伙伴大会上,联想正式宣布与火山引擎牵手合作,为其 AI 桌面助手如意(AI Stick),植入豆包大模型“超强大脑”,全方位提升用户体验。 作为日常办公、学习和休闲娱乐的主力设备,PC 承载着用户信息获取、知识探索、内容输出等多样化的场景需求。 全新升级后的如意,推出了 AI 搜索、AI 写作、AI 聊天三大 AI 新功能,可以让用户按需打造专属个性化 AI 空间。
字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品
豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。
豆包电脑版上线视频生成功能,部分用户可体验
记者获悉,近日,字节跳动视频生成模型 PixelDance已在豆包电脑版正式开启内测,部分用户已开通体验入口。 内测页面显示,用户每日可免费生成十支视频。 PixelDance视频生成模型于9月底首次发布,最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测,外部对其多镜头组合、运镜切换及人物运动能力评价较好。
字节跳动豆包电脑版上线视频生成功能,内测用户每日可免费生成十支视频
字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
豆包支持带有指定文字的图片生成,App已开启测试
近日,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。 用户可以在生图提示词中加入文本要求,如“一张带有「新年快乐」的图”,即可生成带有指定文字的图片。 目前该功能已经在豆包APP开启测试,即梦也已小范围测试。
字节跳动豆包 AI 文生图“喜提新技能”:App 可生成带有指定文字的图片
字节跳动旗下智能AI助手豆包现已升级文生图能力,支持一键生成指定文本。
字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”
据界面新闻3日消息,字节跳动旗下AI助手豆包现已上线图片理解功能,豆包App及豆包PC新增照片及相机按钮,上传图片后可识别图片内容。
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。
即梦AI首发,字节自研视频生成模型Seaweed开放使用
11月8日,字节跳动旗下的AI内容平台即梦AI宣布,即日起,由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。 用户登陆后,在“视频生成”功能下,视频模型选择“视频S2.0”即可体验。 图说:即梦AI PC端和App端模型使用入口9月底,字节跳动正式宣布向AI视频领域进军,发布豆包模型家族的两款视频生成模型Seaweed和Pixeldance,并通过即梦AI、火山引擎分别面向创作者和企业客户小范围邀测。
字节跳动与清华 AIR 成立联合研究中心,推动大模型产学研合作
清华大学智能产业研究院(AIR)- 字节跳动“可扩展大模型智能技术联合研究中心(SIA Lab)”今日在清华大学举行成立仪式。字节跳动介绍称,近年来人工智能呈爆发式发展,预训练大语言模型(Pre-trained Language Model)已经成为迈向通用智能的重要发展路线之一。全球科技公司与研究机构正在投入大量资源研究预训练大语言模型,字节跳动组建豆包大模型团队,在相关领域持续研究与投入,致力于开发业界先进的 AI 大模型技术,成为世界一流的研究团队。
字节豆包推出AI智能体耳机Ola Friend,售价1199元
10 月 10 日,字节跳动豆包发布了首款 AI 智能体耳机 Ola Friend。这是一款开放式耳机,单耳6.6克同类最轻,实现了几乎无感的佩戴感受。该款耳机接入豆包大模型,并与豆包 APP 深度结合。用户戴上耳机后,无需打开手机,便能通过语音唤起豆包进行对话。在官方宣传片中,豆包特别强调了Ola Friend能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。豆包相关负责人表示:“这款耳机是豆包在AI场景的一个探索和尝试,希望Ola Friend能成为随时陪伴用户耳边的朋友。豆包的各种能力也会在后
字节跳动豆包智能硬件 Ola Friend 预热,预计为智能耳机
感谢字节跳动豆包小红书官方号今日发布预热海报,配文为 "字节跳动豆包的智能硬件?",10 月 10 日上午 11 点将公布更多信息。AI在线注意到,Ola Friend 官方微博也已经上线,发布内容与豆包小红书官方号相同。号称“探索 AI 使用新方式”。消息称字节 AI 硬件团队的第一款产品为智能耳机,该款耳机将植入豆包大模型,并与字节 2023 年 8 月上线的对话类 AI 应用豆包 App 结合:戴上智能耳机后,用户可通过语音对话随时使用豆包,在豆包 App 上也可以操控这款耳机。字节跳动在 9 月完成对开放式
字节跳动发布豆包视频生成模型,这效果让我分不清 AI 与现实
9 月 24 日,火山引擎 AI 创新巡展在深圳举办,带来了豆包大模型的最新进展。豆包大模型家族迎来了新成员。具体来说,火山引擎全新推出了豆包・视频生成模型,以及豆包音乐模型、同声传译模型,同时还升级了通用语言模型、文生图模型、语音模型,不断增强各类模态以及规模化的调用量,让豆包大模型“更强模型、更低价格、更易落地”的优势持续凸显。此外,多家行业客户也在会上分享了大模型应用的实践经验。本次豆包带来的一系列大模型进展中,最引人关注的,莫过于全新豆包视频生成模型,它能够带来影视级视觉感受的视频生成效果,全面推动豆包大模
字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了
刚刚,字节的火山引擎的发布会基本结束了。
我现在有点过于激动。
虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。
字节正式发布了他们全新的两款 AI 视频模型:
豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。
他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。
真的,如果要给这个豆包 PixelDance