AI资讯列表 - AI在线

一文详解打光神器 IC-Light！可控制光照方向和色彩氛围，免费使用

大家好，这里是和你们一起探索 AI 的花生~ Controlnet、SD WebUI Forge 和 LayerDiffusion 的作者 lllyasviel 大神最近又推出了一个新的项目 IC-Light，可以实现控制一张图像的光照方向和色调氛围，今天一起我们了解一下它的特点及用法~ 相关推荐：一、IC-Light 简介 IC-Light 项目主页： IC-Light 是 "Imposing Consistent Light (营造一致的光线)" 的缩写，它是一个照明控制项目，目前支持通过文本和背景图对前景内

从人机交互角度，聊聊最近爆火的ChatGPT-4o

近日 ChatGPT-4o 的发布会应该是未来几天 AI 圈子最有热度的话题了，其中几条更新其实可以从人机交互的角度解读一下。首先我们还是先来看看 GPT-4o 更新的主要内容（只关注交互角度解读可跳过）：多模态交互能力：ChatGPT 4.0 支持图像和文本输入，并能输出文本，具备多模态交互的能力。这意味着它可以理解图像内容，并生成字幕、分类和分析等操作。自然语言理解能力提升：在自然语言理解方面有显著提升，这使得 ChatGPT 4.0 能够更好地理解用户的输入，并根据用户的语境提供更准确的回答。上下文长度增

AIGCRank：2024年4月AI排行榜，5款国内产品上榜全球TOP100

AI在线发布：2024年4月全球和国内AI网站流量排行榜。榜单数据来自公开平台，AIGCRank 没有对数据做任何修改，排名公平公正，极具行业参考价值。你可放心转载、分享榜单，获取榜单原始数据请在公众号后台回复「AI」。

李飞飞揭秘创业方向“空间智能”：视觉化为洞察，看见成为理解，理解导致行动

斯坦福李飞飞创业后，首次揭秘新概念“空间智能”。这不仅是她的创业方向，也是指引她的“北极星”，被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察；看见成为理解；理解导致行动。李飞飞最新 15 分钟 TED 演讲完整公开，从数亿年前生命进化的起源开始，到人类如何不满足于自然赋予而发展人工智能，到下一步如何构建空间智能。而 9 年前，正是在同一个舞台上，李飞飞向世界介绍了刚诞生不久的 ImageNet—— 这一轮深度学习爆发的起点之一。她本人也向网友自我安利：如果把两个视频都看了，你就能对过去 10 年的计算机视觉

为客服人员减轻压力，软银将通过 AI 来“软化”客户的愤怒语气

对于一家公司的客服人员来说，同那些怒气冲冲打来电话的客户打交道，可能会带来极大的工作压力。据路透社、Japan Times 报道，软银公司当地时间周三为此提供了一种新的解决方案：通过人工智能技术，来缓和客户的语气。软银计划在明年开始这项技术的内部、外部测试，并将在 2026 年 3 月底之前实现商业化。据介绍，这种解决方案可将客户的声音转换成平和的对话语气，并利用人工智能情感识别和语音处理技术，将客户的诉求传递给员工。图源 Pexels软银方面称，该方案可在通过良好的沟通与客户保持良好关系的同时，确保员工的心理健康

全新Flyme AIOS登场！手机特种兵魅族21 Note全系16GB大内存，仅2599元起

All in AI开启新征程。

经典手游“汤姆猫”实体化，旗下 AI 儿童陪伴机器人已开展工业设计、嵌入式系统开发工作

汤姆猫今日在电话交流会中透露，公司海外研发团队正进一步丰富首款 AI 手游《Talking Ben AI》的玩法与该产品的个性化交互能力，并在测试中持续进行数据搜集，用于优化数据库、模型能力。此外，该公司机器人研发团队已就汤姆猫 AI 儿童陪伴机器人开展工业设计与嵌入式系统的开发，后续将在产品主要功能完善后推进打样及测试工作。今年 3 月，汤姆猫还透露，公司 AI 硬件团队正研发一款基于生成式人工智能技术的 AI 语音交互陪伴机器人，预计将为公司业务带来全新增长空间。此前一款全新适配 MR / VR 硬件的产品原型

世界最大开源 AI 社区 Hugging Face 将免费提供 1000 万美元共享 GPU，帮助小企业对抗大公司

世界最大的开源 AI 社区 Hugging Face（IT之家注：通称“抱抱脸”）日前宣布，将提供 1000 万美元的免费共享 GPU 帮助开发者创造新的 AI 技术。具体来看，Hugging Face 这次做出此举的目的是帮助小型开发者、研究人员和初创公司对抗大型 AI 公司，避免 AI 进步陷入“集中化”。Hugging Face 首席执行官 Clem Delangue 在接受 The Verge 采访时表示，对能够投资社区感到很幸运，此次之所以能够进行投资，是因为公司“已经盈利，或正走在盈利的路上”。前段时间

李彦宏：百度搜索 11% 结果由 AI 生成，搜索最可能成 AI 时代“杀手级 App”

在百度 2024 年第一季度财报电话会上，百度创始人、董事长兼首席执行官李彦宏表示，目前百度搜索上已有 11% 的搜索结果由 AI 生成，让搜索能更准确、更有组织、更直接地回答用户问题。李彦宏表示，百度搜索的 AI 重构工作仍处于早期阶段，整体来看，搜索最有可能成为 AI 时代的 Killer App（杀手级应用）。“文心一言”发布一年多，用户数量已突破 2 亿，文心大模型日调用量也达 2 亿。百度于近期推出多个轻量级大语言模型，并上线 Agent Builder、App Builder 和 Model Build

百度李彦宏：小米、OPPO、vivo、三星、荣耀、联想、蔚来均已接入文心大模型

在百度 2024 年第一季度财报电话会上，百度创始人、董事长兼首席执行官李彦宏透露，继上季度与中国三星、荣耀合作后，本季度，小米、OPPO、vivo 等手机厂商均接入文心大模型 API。大模型的合作领域还在从手机向 PC 和电动汽车领域拓展，联想和蔚来汽车也在季度内达成合作。李彦宏表示，向智能设备的拓展，为文心大模型被更大规模用户采用提供了充足机会。IT之家此前报道，今日百度发布 2024 年第一季度财报，报告期内实现总营收 315 亿元，百度核心营收 238 亿元。同时，归属百度的净利润 (Non-GAAP) 为

我们上手实测GPT-4o：速度快到飞起，还能直出板书，但视频分析逊色

机器之能原创作者：山茶花 Cardina作为 OpenAI 有史以来最好的模型， GPT-4o 究竟强在哪里？你要知道，它是一个原生的多模态大模型，可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断，还会「看人脸色」。更重要的是，它还免费！赶紧薅一把，你会知道什么是真・科幻照进现实！实测 GPT-4o：速度飞快，视觉能力惊艳打开 ChatGPT 官网，就会收到 GPT-4o 的试用邀请，点击「立即试用」即可进入对话页面。如果没有收到邀请，可能是灰度测试阶段，稍等一会再重新进入。然后，直接在下方的

入选国际数据库顶级会议ICDE，腾讯云数据库技术创新获权威认可

今日获悉，腾讯云数据库2篇论文入选国际数据库顶级会议ICDE。其分布式事务协议——Lion和内存-磁盘跨越索引设计框架，解决了数据库领域的普遍难题，技术创新获得国际权威认可。（腾讯云数据库团队在ICDE会场进行技术分享）据悉，ICDE（IEEE International Conference on Data Engineering）是数据库研究领域历史悠久的国际会议，与SIGMOD、VLDB并称数据库三大顶级会议，也是中国计算机学会(CCF)推荐的A类国际会议，主要聚焦设计、构建、管理和评估高级数据密集型系统和应

拿纱布、抓针头，英伟达与多所高校合作，开发手术机器人

编辑 | X英伟达（NVIDIA）正与学术研究人员合作，研究手术机器人。NVIDIA 联合多伦多大学、加州大学伯克利分校、苏黎世联邦理工学院和佐治亚理工学院的研究人员开发了 ORBIT-Surgical，一个训练机器人的模拟框架，可以提高手术团队的技能，同时减少外科医生的认知负担。受腹腔镜手术（又称微创手术）训练课程的启发，它支持十多种操作，比如抓住像针头这样的小物体，从一只手臂传递到另一只手臂，并高精度地放置它们。基于物理的框架是使用 NVIDIA Isaac Sim 构建的，这是一个用于设计、训练和测试基于 A

微软研究院刘铁岩：AI for Science，憧憬一个人人都可参与科学发现的未来

作者 | 刘铁岩正处于起步阶段的AI for Science被认为是科学发现的第五范式。尽管目前对于AI for Science的定义和研究方向仍有诸多讨论，但这并不妨碍AI for Science已经开始在科学发现的实践中取得令人瞩目的成果。近年来，微软研究院科学智能中心杰出首席科学家刘铁岩博士和他的团队致力于推动AI for Science的发展和应用。在这篇署名文章中，刘铁岩博士将分享他对人工智能在科学领域关键研究方向的看法，以及对AI for Science未来前景的展望。「AI for Science预

行业首发多模态大模型辅助视障人士，vivo 看见 App 接入蓝心大模型

感谢vivo 今日宣布，vivo 看见 App 全新升级，接入蓝心大模型，成为行业首款多模态大模型视觉辅助产品。在 vivo 应用商店搜索“vivo 看见”即可下载（IT之家备注：目前仅支持 vivo / iQOO 手机）。vivo 看见支持实时语音播报，镜头对准周围环境和物品即自动播报画面内容及文字信息，还可切换到文字、卡证、条码等多种识别模式。定格画面后点击“对话”，即可与 vivo 看见进行多轮语音对话，轻松获取更多画面内的细节信息。vivo 看见可识别二维码及商品条码，支持识别支付宝、微信收款码，同时发出语

对话零一万物：大模型产品要找到 TC-PMF

上次零一万物（以下简称“零一”）开发布会还是在 2023 年 11 月，宣布成立后的模型首秀：发布中英双语大模型“Yi”，并将其开源。这一次，时隔半年，零一不仅将基座模型卷到千亿量级，甚至还直接拿出一款 C 端新品“万知”，零一万物创始人李开复称其为“AI-First 版 office”。在模型层，零一发布了千亿参数的 Yi-Large 闭源模型，在第三方评测基准斯坦福大学的英语排行 AlpacaEval 2.0上，Yi-Large 可与 GPT-4 比肩（如下图所示）；并全面升级了开源模型系列 Yi-1.5，分为 34B、9B、6B三个版本，且提供了 Yi-1.5-Chat 微调模型可供开发者选择。

用GAI定义手机，联发科和朋友们在行动

天玑旗舰芯片，正在引领 AI 手机新时代。最近一段时间，端侧生成式 AI 上游的「军备竞赛」异常激烈。上个星期，联发科技（MediaTek）举行了首届天玑开发者大会 2024（ MDDC 2024 ），正式发布最新一代芯片与 AI 工具。苹果为新一代 iPad Pro 首次搭载了 M4 芯片，AI 算力相较第一代提升了 60 倍。本周一，vivo 发布的旗舰手机 vivo X100S 系列搭载天玑 9300 ，再次刷新了 AI 手机性能的上限。距离 vivo X100 的发布仅过去半年，在这次的升级版上，vivo

18个月，OpenAI这支团队搞出了GPT-4o

奥特曼：如果没有他（Prafulla Dhariwal）的远见、才华、信念和决心，就不会有 GPT-4o。「GPT-4o 的诞生离不开 @prafdhar 的远见、才华、信念和长期以来的坚定决心。正是这些努力（以及许多其他人的工作）促成了我希望会成为计算机使用方式革命的成果。」在 OpenAI 发布新一代旗舰生成模型 GPT-4o 后的两天，OpenAI CEO 奥特曼对参与该项目的其中一位负责人评价道。紧随其后，联合创始人 Greg Brockman 表示：「GPT-4o 是整个团队努力的结果。特别要感谢 @pr

资讯列表