应用
全面突围,谷歌昨晚更新了一大波大模型产品
这次,谷歌要凭「量」打败其他竞争对手。当地时间本周二,谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品,包括 Gemini 1.5 Pro 首次提供了本地音频(语音)理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 Axion 等等。Gemini 1.5 ProGemini 1.5 Pro 是 Google 功能最强大的生成式 AI 模型,现已在 Google 以企业为中心的 AI 开发平台 Vertex AI 上提供公共预览版。这是谷歌面向
亚马逊 AI 超市「无人」收款,1000 个印度人藏在背后……
就离谱,都 2024 了,人工智能靠人工的戏码还在上演。而且是类似 ATM 机背后坐真・柜员给你递钱的那种!当你走进一家超市,挑选完商品,无需人工、自助结账,直接拿好东西走人,等待一段时间,AI 就能基于视频识别出你选了哪些东西,然后把账单发送过来,你只需点击付款。听着是不是很方便?“拿 1000 个印度人换来的”。在摄像头背后,有一个规模达千人的印度团队,需要通过肉眼远程查看顾客拿了什么商品。好家伙,新的等式出现了:AI=Anonymous Indians(姓名不详的印度人)???这就是最近被曝光的亚马逊无人超市
Mistral开源8X22B大模型,OpenAI更新GPT-4 Turbo视觉,都在欺负谷歌
真有围剿 Google 的态势啊!在谷歌昨晚 Cloud Next 大会进行一系列重大发布时,你们都来抢热度:前有 OpenAI 更新 GPT-4 Turbo,后有 Mistral 开源 8X22B 的超大模型。谷歌内心:南村群童欺我老无力。第二大开源模型:Mixtral 8X22B今年 1 月,Mistral AI 公布了 Mixtral 8x7B 的技术细节,并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型的性能在人类评估基准上明显超过了 GPT-3.5 Turbo、Claude-2.
英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡
性能有优势,可扩展性也更好。英伟达的 AI 加速卡,现在有了旗鼓相当的对手。今天凌晨,英特尔在 Vision 2024 大会上展示了 Gaudi 3,这是其子公司 Habana Labs 的最新一代高性能人工智能加速器。Gaudi 3 将于 2024 年第三季度推出,英特尔现已开始向客户提供样品。凭借 1835 TFLOPS 的 FP8 计算吞吐量,英特尔相信它足以在广阔的(且昂贵的)AI 计算领域中分得一杯羹。根据内部基准测试,英特尔估计 Gaudi 3 性能部分超过了英伟达的 H100,并且具有更好的能耗比。在
谷歌推出 AI 创作应用 Google Vids:会 PPT 就能做视频、支持多人协作
过去传统办公一直围绕着文档、电子表格和幻灯片(如微软的 Word、Excel、PowerPoint,苹果的 Pages、Numbers、Keynote,谷歌的 Docs、Sheets、Slides)。现在,谷歌想要增加一个名为 Vids 的应用程序,使用户比以往任何时候都更容易地制作协作可共享的视频。Vids 是一款全新的 AI 应用程序,可以帮助用户生成视频内容的分镜脚本、选择风格、编辑草稿,同时还提供预录制的旁白功能,并支持项目的安全协作和共享,预计将在 6 月份之前登陆 Workspace Labs 测试版。
苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V
编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存在绝对的优势。 不久前,苹果叫停了启动十多年且投入数十亿美元的自动驾驶电动汽车项目,美国总部裁员了600多人,另有近2000名员工转到AI部门。 然而,在目前市场上的主流智能手机品牌中,苹果几乎是唯一一家尚未正式推出大模型的厂商。
专访腾讯AI Lab姚建华、杨帆:腾讯 AI Lab 为何瞄准单细胞蛋白质组学?
在生物医学研究的前沿领域,“单细胞蛋白质组学”是怎样的存在? 用一个比喻来说,它就像一把钥匙,能够开启细胞内部世界的大门,让我们得以窥见细胞如何通过蛋白质的相互作用来执行生命活动。 这一研究领域的突破,不仅能够推动科学界对生命过程的理解,也为精准医疗的实现奠定了基础。
10 秒总结 YouTube 视频,原阿里首席 AI 科学家贾扬清打造浏览器插件 Elmo
原阿里首席 AI 科学家贾扬清在 X(推特)上分享了插件 Elmo,该插件能在 10 秒内总结 Google Next 主题演讲,生成一句话概括、摘要、主要观点。该插件由贾扬清去年创办的 AI 公司 Lepton AI 打造。贾扬清表示,Elmo 采用了数据公司 Databricks 推出的开源大模型 DBRX。据悉,DBRX 具有 1320 亿个参数,采用 MoE 架构,在性能上超过了 GPT-3.5 和其他一些开源模型。经过IT之家的测试,时长达 1 小时 22 分的苹果 2023 秋季发布会,Elmo 仅用时
英特尔预计今年出货 4000 万台 AI PC
在 Intel Vision 2024 大会上,英特尔 CEO 帕特・基辛格透露,英特尔目前已经出货了 500 万颗人工智能 PC 芯片,预计将于 2024 年出货 4000 万台 AI PC,以超过 230 种的设计,覆盖轻薄 PC 和游戏掌机设备。英特尔的目标是到 2025 年,为超过 1 亿台 AI PC 供应处理器。据IT之家此前报道,上月底英特尔公司宣布“AI PC 加速计划”再添两项人工智能(AI)新举措,即新增“AI PC 开发者计划”,并吸纳独立硬件供应商(IHV)加入“AI PC 加速计划”。对于
韩国计划到 2027 年在 AI 半导体领域投资 9.4 万亿韩元,目标成为 AI 技术三强
据韩联社消息,韩国总统尹锡悦在昨日举行的韩国“半导体领域待审问题会议”上表示,韩国政府计划到 2027 年在 AI 半导体领域投资 9.4 万亿韩元(IT之家备注:当前约 502.9 亿元人民币)。除了直接投资外,韩国还计划创建一笔价值 1.4 万亿韩元(当前约 74.9 亿元人民币)的基金,帮助 AI 半导体创企的发展。尹锡悦称当前的半导体竞争是“一场工业领域的战争,一场国家层面的战争”,因此韩国需要在未来 30 年在 AI 领域建立如现在存储产业的影响力。为此韩国将全面审查半导体产业投资激励政策,建立同这一“战
ChatGPT 首次公开出现在电视剧音乐创作人员名单中
印度泰卢固语喜剧《Save the Tigers》第二季大结局出现了片尾彩蛋,这并不是指剧情方面,而是在演职员表中的音乐团队中明确标注 ChatGPT。这表明团队在制作该剧的 Club 音乐过程中,调用了 ChatGPT 参与制作,只是目前尚不清楚具体的贡献程度。电视剧团队在制作音乐过程中调用 ChatGPT 可能并非首次,但这应该是 AI 聊天机器人首次公开用于音乐创作。IT之家查询相关报道,观众对这个彩蛋的反应不一,一些观众认为这很有趣,并说这可能是人类音乐制作人的别名;另一些观众则称赞该电视剧在人工智能署名方
Instagram 短视频板块 Reels 测试 AI 同传功能,用户可用自己声音“说外语”
开发者 Alessandro Paluzzi 今日在 X(推特)上公布了自己的最新发现:Instagram 的短视频板块 Reels 正在测试“AI 语音配音”功能,带来类似“同声传译”的体验。其放出的截图显示,Instagram 的 Reel 页面上出现了“Instagram 将通过 AI 来使你的声音听起来就在说另一门语言一样”的字样。下方的详情内容大意如下:观众将听到您的音频以您选择的语言配音。对于您现在或将来发布的 Reels,您可以为部分或所有语言关闭此功能。翻译和配音准备就绪后,您将收到通知。人们可以看
谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频
谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。据称,这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。谷歌称,Gemini 1.5 Pro 可以理解复杂的指令,并且无需对
AI在用| 万万没想到,科技论文还能这么读
机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。Claude 3 具有非常大的内存( 200k 上下文窗口)和很强的调用准确性,它的上下文能力也因此成为最受欢迎、应用最广的技能。我们介绍过如何利用这种能力,没时间收听播客也能获取核心内容。今天,我们再介绍一个新技能,
不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局
不降低大模型算法精度,还能把芯片的算力利用效率提升 2~10 倍,这就是编译器的魅力。在《沙丘》构建的未来世界里,「得香料者得天下」。但在生成式 AI 席卷的智能世界里,得 GPU 者得天下。前段时间,外媒 The Information 曝出了一则重磅消息:微软和 OpenAI 正在规划一个雄心勃勃的数据中心项目 —— 建造一台名为「星际之门」的 AI 超级计算机。这台计算机将配备数百万个专用服务器芯片,是目前一些最大数据中心的 100 倍。当然,这个计划是相当烧钱的,成本可能高达 1000 亿美元,令其他公司望
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
「Real men program in C.」众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截?也许很多人开过这样的脑洞,现在有大佬实现了。今天凌晨,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。GitHub 链接:,立即引发了机器学习社区的热烈讨论,项目的 Star 量不到七个小时就冲上了 2000。有网友表示,
2024年WAIC·云帆奖启航:擎启AGI时代,集结超越边界的探索者
2024 年 WAIC・云帆奖面向全球征选 AI 青年技术人才,欢迎点击「此链接」报名或提名。人工智能的研究范式和产业格局正在经历深刻而积极的转变。过去一年,大模型引发了一股席卷全球的智能浪潮,这不仅推动了 AI 技术在更广泛领域的应用,也激发了人类对人工智能深层次潜力的追寻和探索。在这场技术革新的洪流中,通用人工智能(AGI)正逐渐从幻想走进现实。我们正处于一个新征程的起点,这个阶段将以人类对通用智能的不懈追求为特征。迎接即将到来的新时代,让我们将目光投向那些充满激情、勇于探索的青年创新者。他们凭借卓越的智慧和无
杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人
在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。然而,社交技能的练习环境对于大多数人来说通常是遥不可及的。特别是由专家训练这些技能时,往往耗时、投入高且可用性有限。现有的练习和反馈机制很大程度上依赖专家监督,使训练难以扩展。此外,经过专业培训的教练也缺乏,而大多数可以提供定制化反馈的教练无法帮助大量有需要的人。近日,在由斯坦福助理教授杨笛一为共同一作的论文《Social S