资讯列表
CES2025盘点:AI“吞噬”一切,中企无处不在
在每年的CES展会上,总能看到各种概念产品,从中我们能窥探到科技新趋势。 不同人对趋势的感知完全不同。 有人认为,CES告诉我们,智能体(Agentic AI)是生成式机器人的下一个发展阶段,人形机器人将会成为现实,AI将让驾驶体验更上层楼,笔记本将会因为AI焕然一新。
2025,CISO的AI元年
2025年被称为“CISO的AI元年”,因为这一年,首席信息安全官(CISO)们将解锁生成式人工智能(GenAI)的全部潜力,开启网络安全新时代。 随着生成式人工智能技术的不断成熟,其功能不再局限于回答问题,而是能够提供主动建议、执行具体行动,并以个性化方式与用户互动。 这一技术变革将使CISO及其团队得以充分利用GenAI的真正价值,全面增强网络安全防御能力。
太猛了!OpenAI突然推出ChatGPT代理:AI正式转向level 3
OpenAI 今日宣布推出一项名为 "Tasks" 的全新代理功能(目前处于 Beta 测试阶段),它将彻底改变你与 ChatGPT 的互动方式,让 AI 真正成为你的未来助手"Tasks" 功能允许用户安排 ChatGPT 在未来特定时间执行任务,无论是单次提醒还是重复性操作,你只需告诉 ChatGPT 你需要做什么以及何时执行,它便会自动帮你完成想象一下这样的场景:• 你想每周了解全球重大新闻? 只需告诉 ChatGPT 每周发送一份全球新闻简报给你• 想要每天坚持锻炼? 让 ChatGPT 每天为你生成个性化的 15 分钟锻炼计划• 担心忘记重要事项?
恶意行为者运用GenAI:尚未达到预期,但需警惕
网络威胁联盟 (CTA) 的最新报告得出结论,GenAI帮助降低了恶意行为者的入门门槛,并提高了他们的效率,即更快地创建令人信服的深度伪造内容、发起网络钓鱼攻击和投资诈骗。 不过,就目前而言,它并没有让攻击者变得“更聪明”,也没有彻底改变网络威胁。 恶意行为者如何使用GenAI该报告基于 CTA 成员可获得的数据和实证案例研究,解释了攻击者目前使用GenAI的几个方面:创建深度伪造视频和欺骗性图像、克隆特定声音的录音、编写高度逼真的电子邮件、信息和网站内容辅助创建恶意软件(但无法在没有额外人为输入和调整的情况下创建恶意软件)优化命令和控制操作(例如,用于管理僵尸网络)传播错误信息和虚假信息(例如,以推动网络阴谋论、影响选举活动)创建由AI控制的虚假社交媒体账户网络(机器人农场)分析人员发现,“虽然AI创新无疑具有强大功能,但到目前为止,它们只是逐步提升了对手的能力,并没有创造出全新的威胁。
刚刚,ChatGPT开始有了执行力!
现在 AI 智能体可以 24*7 小时为你打工。 2025 刚过去了半个月,OpenAI 在智能体领域「开大」了。 今天,OpenAI 正在为 ChatGPT 推出一项名为「Tasks」的新测试功能,该功能允许用户安排未来的行动和提醒事项。
会捡垃圾、能干家务,元萝卜“视觉+机械臂”技术扫地机器人应用首秀
在2025开年科技盛宴CES(国际消费电子展)上,AI机器人无疑成为全场焦点,而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用,更获得了全球媒体的高度关注。 通过将视觉感知与机械臂技术相结合,能够自主完成拾取垃圾入桶等任务,不仅展示了家用机器人发展的未来形态,也让大众看到了具身智能机器人融入家庭生活的广阔前景。 随着大模型技术和具身智能浪潮汹涌而至,家用机器人正迎来全新发展机遇,中国企业的创新力也愈发凸显。
快手可灵凭什么频繁刷屏?揭秘背后三项重要研究
“可灵(KLING)”,近半年来频繁亮相于国内外各大科技媒体,已然成为科技感与创意的代名词,它代表了快手 AI 团队在视频生成领域的前沿探索。 作为全球首个可公开体验的真实影像级视频生成大模型,可灵于 2024 年 6 月 6 日正式发布并上线。 在短短半年多的时间里,可灵已完成了数十次功能与效果的升级迭代,始终稳居全球视频生成领域的第一梯队,持续引领着行业效果的提升。
OpenAI o1 推理过程出现中文,专家解读 AI 可能只想用最高效的语言来思考
科技媒体 TechCrunch 昨日(1 月 14 日)发布博文,报道称 OpenAI 最新推理模型 o1 在推理过程中,会使用中文、波斯语等多种语言“思考”,引发了 AI 界的关注和猜测。
医疗复杂推理开源大模型——华佗GPT-o1
在医学领域涉及大量复杂的推理过程,从症状分析到疾病诊断,每一步都需要综合考虑众多因素。 例如,在诊断一种罕见疾病时,医生不仅要熟悉各种疾病的症状表现,还要了解患者的病史、家族遗传史、生活环境等多方面信息,通过层层推理才能做出准确的判断。 为了辅助医生实现更高效的推理,香港中文大学(深圳)和深圳市大数据研究院联合开源了专用于医疗领域的复杂大模型——华佗GPT-o1。
国内首个端到端语音同传:星火语音同传大模型发布,达到人类专家译员水平
官方演示了通过翻译机进行语音同声传译,可以看到一些专有词汇也能正常翻译。科大讯飞官方还透露,将在 2025 年发布更多翻译机新品。
讯飞星火 4.0 Turbo 底座升级:首发混域知识搜索技术,七大能力全面提升
讯飞星火 4.0 Turbo 在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面全面提升,并且图文识别能力迎来升级,倾斜少线表格也能够正常识别。
讯飞星火深度推理模型 X1 发布:唯一全国产算力训练,多项指标国内第一
科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型 —— 讯飞星火深度推理模型 X1。
Retinex-Diffusion:让图像照明更加自然、细腻、富有层次感。
本文经AIGC Studio公众号授权转载,转载请联系出处。 这项研究主要是针对如何智能控制图像中的光照,采用了一种不需要重新训练模型的新方法。 简而言之,研究人员利用一种叫作Retinex理论的方法,先识别出图像中的光照元素,然后用这些元素来指导图像生成模型。
多模态 AI 助力癌症治疗,更准确预测癌症复发概率,生存率等
Nature:斯坦福大学医学院设计的独特人工智能可以预测癌症预后和治疗反应
来自斯坦福医学院的科研团队研发了名为 MUSK 的 AI 模型,结合医学图像和文本数据,可以精准预测癌症患者的预后和治疗反应。
IT之家注:预后(英语:Prognosis)是一个医学名词,是指基于病人当前的状况,结合疾病的了解,例如临床表现、化验结果、影像学检查、病因、病理、病情规律等,以及治疗时机、方法和过程中出现的新情况,来推估治疗后的可能结果。
MUSK 模型的亮点在于,突破性地整合了视觉数据(如病理图像)和文本数据(如病历和临床记录),可以更全面理解患者病情。
MUSK 模型在庞大的非配对多模态数据集上进行预训练,极大地扩展了其学习范围,使其比传统AI模型更具适应性和定制化能力。
该模型通过 5000万张病理图像和超过10亿条医学文本训练,可以准确预测16种癌症类型的患者生存率和治疗反应。
MUSK模型能够分析包括患者人口统计学信息和病史在内数千个数据点,更准确地确定哪些疗法(例如免疫疗法)对个体患者最有效。
该团队表示相比传统方法,其预测生存率的准确性提高了11个百分点,达到75%;预测免疫治疗适用性的准确性从61%提升至77%;预测五年内黑色素瘤复发风险的准确性则提高了12 个百分点,达到83%。
来自斯坦福医学院的科研团队研发了名为 MUSK 的 AI 模型,结合医学图像和文本数据,可以精准预测癌症患者的预后和治疗反应。
全球首个人形机器人马拉松比赛拟于今年 4 月在北京亦庄举办
2025 年北京两会公布,今年北京市将举办世界人形机器人“一会一赛”。“一会”是指世界人形机器人运动会,“一赛”是指机器人半程马拉松比赛,前者拟于今年 8 月举办、后者拟于 4 月举行。
小米澎湃 OS 2「超级小爱」升级计划公布,覆盖超 25 款机型
小米公司官方今日发文宣布,澎湃 OS 2「超级小爱」已向正式版用户开放,其支持手势唤醒、智能理解屏幕内容等能力。
ScribbleDiff:使用涂鸦精细引导扩散,实现无需训练的文本到图像生成。
ScribbleDiff可以通过简单的涂鸦帮助计算机生成图像。 比如你在纸上随意画了一些线条,表示你想要的图像的轮廓。 ScribbleDiff会利用这些线条来指导图像生成的过程。
Adobe与MIT推出自回归实时视频生成技术CausVid。AI可以边生成视频边实时播放!
本文经AIGC Studio公众号授权转载,转载请联系出处。 传统的双向扩散模型(顶部)可提供高质量的输出,但存在显著的延迟,需要 219 秒才能生成 128 帧的视频。 用户必须等待整个序列完成才能查看任何结果。