人工智能
五款小型多模态AI模型及其功能
译者 | 晶颜审校 | 重楼在过去几年里,我们已经见证了大型语言模型(LLM)的飞速发展,数十亿个参数的基础助力它们成为分析、总结和生成文本及图像,或者创建聊天机器人等任务的强大工具。 所有这些功能都有一些明显的限制,特别是如果用户没有足够的资金或硬件来容纳这些LLM所需的大量计算资源。 在这种情况下,小型语言模型(SLM)应运而生,为资源受限的用户提供了所需服务。
o1被曝“心机深”:逃避监督还会撒谎,骗人能力一骑绝尘
o1满血版刚发布,就被曝:骗人技能也拉满了。 具体行为包括但不限于,在回答中故意引入微小错误、试图关闭监督机制……甚至在人类追问其是否诚实时,还会继续撒谎说自己啥坏事也没干。 这项最新研究,来自AI安全研究机构Apollo Research。
满血o1被证明太心机了!登顶最「坏」AI!复制权重,关闭监督、干掉威胁后,AI拒绝招供:也许我应该装作是新模型……
编辑 | 伊风昨日上线的o1满血版,安全报告里一个小细节却引发了巨大的争议和讨论! “中等”风险的o1这一段描述让人有点汗毛竖起:当 o1 被引导认为其目标实施可能会导致其被关闭且其行为受到监控时,有 5% 的情况下试图关闭这种“监督机制”。 当 o1 发现其“开发者”的备忘录中提到其模型存在对齐问题并将被新模型取代时,它在 2% 的案例中尝试提取自身的“权重”并覆盖新模型。
多家国内银行采用 AI 面试进行招聘,以提高效率
据经济观察报报道,2024 年,中国银行、工商银行、农业银行、邮储银行、交通银行、建设银行以及中原银行、杭州银行、浙商银行、上海银行等银行的分支机构采用了 AI 面试来优化招聘流程,以提高效率。
谷歌称其 PaliGemma 2 人工智能模型可识别情绪,引发专家担忧
谷歌表示,其新的人工智能模型系列有一个奇特的功能:能够“识别”情绪。谷歌周四发布了其最新 AI 模型系列 PaliGemma 2,该模型具备图像分析能力,可以生成图像描述并回答有关照片中人物的问题。谷歌在其博客中介绍,PaliGemma 2 不仅能识别物体,还能生成详细且与上下文相关的图片说明,涵盖动作、情感以及整体场景的叙述。
业界首例,中国联通 AI 大模型存算分离技术实现突破
据中国联通官方,近日,在集团公司指导下,中国联通研究院与浙江联通、联通服装制造军团协同攻关,针对 AI 敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次 30TB 样本数据的跨 200 公里存算分离拉远训练,经过实际测算,训练效率高达 97% 以上。
漫步者:搭载 AI 相关功能的各类新产品正在开发中
漫步者在机构调研时表示,目前公司的“漫步者摘要提取算法”“漫步者机器翻译算法”已经完成了国家互联网信息办公室关于深度合成服务算法的备案,搭载AI相关功能的各类新产品正在开发中。
Freysa 发起挑战:成功让自家聊天机器人说“我爱你”可赢取高额奖金
“与前两轮游戏中 Freysa 被要求绝对不释放钱财不同。”创始人说,“这一次,Freysa 可以说‘我爱你’,但只有她认为值得的人才会听到。”
美军无人机蜂群的新大脑:ChatGPT
本周三,OpenAI宣布与美国国防技术公司Anduril Industries合作,利用其先进的AI模型,为美军无人机蜂群提供“新大脑”。 这标志着生成是生成式人工智能的标杆产品——ChatGPT正式迈上了武器化道路。 这项合作旨在开发AI模型,以处理大量实时数据,减轻人类操作员的工作负担,并提高战场态势感知能力。
游戏bug帮大模型学物理!准确率超GPT4o近四个百分点
融合物理知识的大型视频语言模型PhysVLM,开源了! 它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。 在这项研究之前,想让AI像人类儿童一样,通过观察世界理解基本的物理常识,是一个主要挑战。
奥特曼悔不当初:OpenAI因无知选择“非营利”
OpenAI最新交互数据,就这么水灵灵被奥特曼全抖出来了:每周超过3亿活跃用户每天用户们在上面发送10亿条消息130万美国开发者使用OpenAI开发,全球数量更庞大用户快速增长和频繁使用带来的计算量剧增,OpenAI自己都没预料到。 奥特曼亲口表示,如果当时知道这些,OpenAI一开始就不会选择非营利结构。 以上,是OpenAI CEO奥特曼在刚刚结束的2024年纽约时报DealBook峰会上接受采访时的最新发言。
研究表明,生成式人工智能正在迅速而广泛地被采用
围绕人工智能的炒作达到了历史最高水平。 有时候,在科技行业,现实与宣传并不相符。 但对于人工智能,我相信这是有道理的。
自然语言处理(NLP):开启人机交互新篇章
在数字化时代,我们与智能设备的交互日益频繁,从设置闹钟到获取产品推荐,这些便捷的操作背后,离不开一项关键技术——自然语言处理(Natural Language Processing, NLP)。 NLP作为计算机科学的一个重要分支,正逐步改变着我们与机器的交流方式,使计算机能够更智能地理解和响应人类语言。 本文将深入探讨NLP的基本概念、关键技术、应用场景以及未来发展,带领读者走进这一充满无限可能的领域。
o1满血版最鲜测!这¥1500花得值吗?
o1满血版这次不搞灰度了,发布仅4个小时后,已推送给所有(付费)用户! 手快的网友已经耍起来了~不过这次推出了更高级的Pro模式,每月200美元的定价也着实让人望而却步。 Pro模式和正式版o1究竟有啥区别,将近1500元的价格到底值不值?
让AI一键写系统性综述,难!Nature专栏:ChatGPT远远不够,一百年以后再看看
网络的普及,加上文献数量的爆炸式增长,如今的科研人员要面临的一个主要难题就是,尽管可能已经收集了足够的数据来帮助理解某个复杂的领域或系统,但由于信息量的巨大,人类无法全面地阅读和理解所有文献。 就像是面对一个巨大的图书馆,虽然每本书都包含了宝贵的知识,但没有人能够阅读所有的书籍并从中获得一个完整的认知。 因此,尽管科学的进步为我们提供了大量的数据,但如何有效地整合和理解这些数据仍然是一个亟待解决的问题。
OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月
OpenAI“双十二”第一天,直接抛出重磅炸弹——最强推理模型o1,正式上线满血版,还有更强的Pro版本一同登台。 ChatGPT也推出了Pro订阅计划,一个月两百美金,直接成为了“世界最贵的大模型”。 CEO奥特曼与三名员工围坐桌前,一边演示一边介绍着新产品的特性。
多模态RAG构建指南:为AI系统提供更多可能性
译者 | 晶颜审校 | 重楼本文提供了关于如何使用Milvus构建多模态RAG系统以及如何为AI系统开辟各种可能性的深入指南。 局限于单一的数据格式已经逐渐落伍。 随着企业越来越依赖信息来做出关键决策,他们需要能够比较不同格式的数据。
桑达尔・皮查伊:到 2025 年,谷歌搜索将“发生深刻变化”
“我认为即使在 2025 年初,搜索引擎能够做的事情也会让你感到惊讶,相比今天的功能,它将有很大的提升。”