用户
夸克发布全新PC端,系统级全场景AI能力升级AI电脑
将一台电脑升级为AI电脑需要几步?今后只需安装一个夸克就够了!8月27日,阿里智能信息事业群旗下夸克发布全新PC端,全面升级AI搜索、AI写作、AI PPT、AI文件总结等一系列功能。凭借“系统级全场景AI”能力,夸克为你升级AI电脑,一站式完成信息的检索、创作和总结。“始终面向用户、面向AI、面向未来,夸克在人工智能领域持续探索突破性的用户体验。”阿里智能信息事业群总裁吴嘉表示,全新的夸克开启了创造革新性搜索产品的无限可能,也为阿里巴巴人工智能战略布局增添了强有力的路径与动能。夸克PC端功能上新,为你升级一台AI
三星宣布将 Bixby 语音助手引入 BESPOKE AI 家电,语音控制更智能
三星已宣布将 Bixby 语音助手引入 BESPOKE AI 系列家电,用户可以通过自然语言向这些家电发出语音指令,Bixby 多年来一直存在于三星的智能手机、智能手表、平板电脑和电视上。三星今天早些时候宣布,将把其人工智能驱动的数字语音助手 Bixby 应用于其 BESPOKE AI 系列家电产品。这个升级的数字语音助手可以理解上下文,其可以理解包含多个命令的自然语言,记住之前的对话,并获取有关设备的信息。Bixby 将扩展至以下家电:Bespoke AI ComboBespoke AI Family Hub 冰
云知声推出山海多模态大模型:实时生成文本、音频和图像
云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲ 云知声山海助手微信小程序AI在线获悉,山海多模态大模型有如下特点:实时秒回,自由插话:与现实对话中人类的响应时间相似;支持对话随时打断,用户可在对话中任意插话感知情绪,表达情绪:通过语音文本判断用户情绪,还能捕捉用户语音的语气、节奏和音调等微妙变化,感知对方情绪状态音色自由切换:根据用户的个性化需求,自由切换音色;学习用户的音色、风格,复刻用户声音
Ideogram 倒逼 Midjourney“拔剑”,开放网页版后再向免费用户开放 AI 文生图提示词描述工具
科技媒体 testingcatalog 昨日(8 月 23 日)发布博文,或许是 Midjourney 感受到来自 Ideogram 最新模型的压力,在昨日开放网页版,并附赠 25 张文生图试用额度之外,还向免费用户推出了“Tools with the Lab”工具。AI在线注:该功能此前已经向购买 Pro 专业版订阅的用户开放,现在向免费用户也开放体验,用户点击后会进入“Describe”页面。用户可以上传任意照片,然后该工具就会提供 4 种不同的描述,之后用户可以将其作为提示词,通过 Midjourney 创建
文生图 AI 工具 Midjourney 开放网页版,新用户附赠 25 张免费试用额度
感谢Midjourney 官方账号在 X 平台发布推文,宣布向所有用户开放网页界面,并重新推出免费试用图像生成功能。Midjourney 此前因其文生图 AI 工具被滥用而暂停免费使用,现在重新向用户开放。科技媒体 The Decoder 认为 Midjourney 此举可能是针对最新上线的 Ideogram 2.0 工具。AI在线附上官方宣传视频如下: 用户无需使用 Discord 即可注册网页版并在网页版中生成图片,Midjourney 还准备了一些常见的提示词帮助以及图片示例,用户可以根据浏览其他用户生成的图
a16z发布《Top100消费级生成式AI应用》榜单 2024年8月
a16z发布《Top100消费级生成式AI应用》榜单 2024年8月
PICO 推出MR混合现实一体机PICO 4 Ultra,为用户提供全新体验
2024年8月20日,PICO在北京举办新品沟通会,正式推出旗下首款MR混合现实一体机PICO 4 Ultra。PICO 4 Ultra的推出标志着PICO在MR技术领域的全新突破,为用户带来了更为丰富和个性化的混合现实体验。硬件层面,PICO 4 Ultra搭载了全新高通骁龙®XR2 Gen 2计算平台以及配备了双目3200万像素彩色透视摄像头和iToF深度感知摄像头,这使得它能够提供出色的性能表现和立体高清彩色透视体验。系统层面,PICO 4 Ultra引入了全景屏工作台,用户可以在现实空间中同时打开和排布多个
力压 DALL-E 3 等顶级模型,谷歌开放 Imagen 3 文生图 AI 访问
科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能,官方称最新版本“节更清晰、光照更丰富、干扰性人工痕迹更少”。谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,I
快手推出“飞船”App:基于“快意”AI 模型,主打虚拟陪伴
快手在发布可灵图生视频模型之后,最新推出了“飞船”(Kraft)AI 对话助手,提供个性化的对话体验。官方介绍称,飞船(Kraft)智能助手 App 是一款基于先进 AI 技术的互动软件,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流,解答疑问、获得娱乐、进行创作和角色定制等。用户在飞船平台上扮演“船长”角色,名为快快的 AI 少女领航员引导用户体验,飞船基于快手自研大模型“快意”,更侧重于虚拟陪伴,拥有快速的回复速度和逼真的语音体验。用户可以在该应用中创建和定制专属 AI 虚拟角色
谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用
豆包上线音乐生成,用户可一键生成词曲
8月8日,字节跳动旗下智能AI助手豆包上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词,设定音乐风格、情绪及音色,便能快速生成一首约1分钟的词曲,每个人都能体验音乐创作和表达的乐趣。目前,豆包音乐生成功能提供民谣、嘻哈、R&B等11种音乐风格,其中还涵盖了爵士、雷鬼、电音等相对小众的曲风,用户可选择男声或女声演唱。生成的声音,在吐字清晰度和流畅性上表现很好。同时,为让AI音乐更好贴合普通用户的情感表达,豆包预设了快乐、伤感等多种情绪状态。借助豆包,用户可以创作更具个人属性的音乐。例如,在一次骑行之
消息称马斯克 X 平台同意不使用部分欧盟用户数据来训练 AI
感谢路透社今天(8 月 9 日)报道,马斯克旗下的 X 平台同意不使用部分欧盟用户数据,来训练其 AI 聊天机器人。爱尔兰一家法院周四表示,社交媒体平台 X 同意在欧盟用户选择撤销同意之前,暂时不使用从他们那里收集的个人数据来训练其 AI 系统。爱尔兰数据保护委员会本周寻求一项命令,要求暂停或限制 X 公司,不得处理用户数据来开发、训练或改进其人工智能系统。AI在线曾于 7 月报道,X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统,此举是在未事先获
OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放,但每天只能生成两张图片
北京时间今天凌晨,OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。AI在线注:DALL-E 3 于去年 9 月推出,起初只面向 ChatGPT Plus 付费订阅用户提供。用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令,但经过实测,这项功能每天只能免费生成两张图片,否则 ChatGPT 会提示“您已达到图片创建上限,升级至 ChatGPT Plus 或于明天 XX:XX 后重试”。▲ AI在线实测生成的图片,下同今年 4 月,OpenAI 宣布 DALL-
AI 时代如何遏制优质内容被过度抓取?谷歌探索网络货币化模式
AI 时代如何避免优质内容被抓取?谷歌正在 Chrome 浏览器中探索网络货币化解决方案,为站长、创作者提供新的营收模式。广告时代走下坡路很多内容创作者、站长都依赖广告维持运营成本,访问网站的人越多,他们和谷歌获得的收入就越多。不过在 AI 时代,用户可以绕过访问这些网站,就能获取他们想要的答案,因此导致内容创作者、站长的收入减少。货币化方案AI在线曾于今年 2 月报道,谷歌正在开发网络货币化规范,用户可以直接向网站付费,通过小额支付预览相关内容,帮站长在广告、订阅等其他传统方式之外开辟新的收入渠道。软件工程师亚历
马斯克 X 平台因抓取用户数据训练 AI 在爱尔兰被起诉
感谢爱尔兰数据保护委员会(DPC)向高等法院提起诉讼,指控马斯克旗下的 X 平台擅用用户数据,用于训练 Grok AI 模型等增强型搜索工具。DPC 已委托 Remy Farrell SC 律师事务所提交诉讼,指控 Twitter International Unlimited Company 公司没有遵守 GDPR 规定的义务,使用用户数据训练 Grok。DPC 表示 X 平台虽然已提供了退出等缓解措施,但该公司仍收集大量欧盟用户数据,在诉讼中,DPC 寻求法院下令禁止或限制 X 使用用户个人数据来开发、训练或改
阿里通义 App 推出“角色扮演”功能,可将视频人物换成“孙悟空”“机器人”
8 月 6 日,通义 App 上线新功能“角色扮演”,用户只需要上传一段视频即可完成“现实与虚拟”的跨界,实现诸如机器人“带娃”、孙悟空“跳舞”、二次元女生“职场搬砖”的效果。AI在线附操作方法:用户准备一段不超过 15 秒的视频,通过“通义 App 频道 角色扮演 开始创作”的顺序进入功能入口,用户也可以在官方提供的视频模板中选择视频,最多可替换视频中的 3 个角色。可选角色方面,官方提供了孙悟空、机器人及两款不同风格的女性角色供用户选择。据介绍,“角色扮演”功能背后的“核心技术”是通义实验室研发的 AI
科大讯飞发布智能办公本Air 2,打造更懂你的办公AI助手
更懂你的AI助手,让办公轻得自在。8月6日,科大讯飞举行“AI懂你,轻得自在”智能办公本新品发布会,正式发布科大讯飞智能办公本Air 2系列。Air 2深度融合了讯飞星火大模型能力,带来会议纪要、笔记分析、AI写作三大AI绝招;Air 2也首次使用了语义转折点识别算法,大幅提升多人会议的分角色转写准确率;此外,Air 2还拥有88.5%超大视觉屏占比,在轻薄便携的同时带来墨水屏视野“大”体验。轻薄超便携,88.5%超大屏占比Air 2采用了8.2英寸E Ink墨水屏,并拥有88.5%超大视觉屏占比,同时依然保持了5
大模型成私人导游:一键规划 Citywalk,港大 MIT 联合出品
现在,大模型可以做私人导游,为你规划 Citywalk 路线了 ——港大 MIT 等单位联合推出 ITINERA,将 LLM 与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的 citywalk 路线”。ITINERA 系统立马生成了一条包含若干地点的路线,并提供了相应的介绍文本。甚至“适合情侣一起去的酒吧”“二次元圣地”“途经网红打卡点”这样的个性化需求,ITINERA 也可以理解和满足。单看可能没感觉,咱们直接对比 ITINERA(左侧)和 GPT