融资快报
Stability AI 获前 Facebook 总裁主导的 8000 万美元投资,并豁免 4 亿美元的债务:由前 Facebook 总裁 Sean Parker 领衔的投资者群体接管这家在商业与运营受阻的 AI 独角兽。新一轮投资的投资者包括 Greycroft、O’Shaughnessy Ventures 和生物技术投资者 Robert Nelsen,老股东Coatue、Lightspeed 以及 Ashton Kutcher 的Sound Ventures 也承诺投资。此外,包括前 Google CEO Eric Schmidt 以及伦敦 Stability AI 早期支持者在内的投资者群体已经与供应商达成协议,豁免 Stability AI 欠下的 1 亿美元债务,同时免除公司未来 3 亿美元的义务,这些债务主要用于云计算服务提供商。
软银将以30亿美元的估值投资Perplexity:软银集团旗下愿景基金投资美国AI初创公司PerplexityAI,计划投资1000万至2000万美元。PerplexityAI旨在利用AI技术挑战谷歌搜索,此次融资总额达2.5亿美元。
思维天空获数千万元天使投资:思维天空是一家主打AI原生在线办公应用公司,对标Notion。公司首轮估值过亿,创始人为阿里前端第一人玉伯(王保平)。
深海智人完成Pre-A轮融资:深海智人是一家海洋智能装备及深海机器人研发生产商,为用户提供技术领先的机器人产品、服务及海洋综合智能解决方案。
Dust完成1600万美元融资:法国初创公司Dust专注于为企业定制人工智能机器人,是帮助企业更便捷地使用大型语言模型的新兴公司之一。本轮融资由知名风险投资机构红杉资本领投。
Astrocade筹集了1200万美元种子轮融资:Astrocade 以AI驱动的游戏编辑器进入市场,允许用户通过文本提示快速生成游戏,显著降低了游戏生成的门槛。创始人为技术和学术界的先锋人物,Amir Sadeghian、Ali Sadeghian和李飞飞。此轮融资的主要投资者包括AME Cloud Ventures、NVIDIA Ventures、Venture Reality Fund以及个人投资者如Eric Schmidt(谷歌公司前CEO)、John Riccitiello(Unity前CEO)、David Baszucki(世界最大的多人在线创作游戏Roblox 的创始人、总裁兼首席执行官)、Jerry Yang(雅虎创始人)等。
Synthflow获740万美元种子轮融资:Synthflow位于德国柏林专注于为中小企业提供无需编码的AI语音助手构建平台。本轮融资由Singular领投,Atlantic Labs等现有投资者以及包括Krisp AI创始人在内的AI领域的多位投资者参与。
(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
国内情报:
原阿里巴巴集团副总裁黄海清加盟上海AI大模型“国家队”:
上海信息投资股份有限公司公布,任命原阿里巴巴集团副总裁、阿里云中国区总裁黄海清为上海库帕思科技有限公司首席执行官。(界面新闻)
百度官方数据显示近八成高考生使用百度AI志愿助手:
全国超1300万考生陆续进入高考填报志愿环节。据百度官方发布的数据,仅6月25日一天,就有超过1000万用户使用了百度AI志愿助手,辅助填报志愿。也就是说,近八成的考生使用了AI志愿填报服务。
科大讯飞发布讯飞星火V4.0版本,安卓端下载量超1.31亿次:
V4.0版本基于国产万卡算力集群“飞星一号”训练,提升了大模型底座核心能力,与GPT-4Turbo形成对标。科大讯飞推出了讯飞星火APP/Desk、星火智能批阅机、讯飞AI学习机、讯飞晓医APP以及星火企业智能体平台等。讯飞星火带动了智能硬件销量的飙升,同比增长高达70%,月均使用次数更是超过4000万次。
百度李彦宏与潍柴董事长探索大模型在商用车智能制造领域合作:
潍柴董事长谭旭光表示,山东重工成立人工智能研究院,希望与百度合作,在全球产业智慧升级中走在前列。李彦宏表示,期待合作用 AI 技术服务国家制造业发展。双方达成共识,将探索大模型在商用车智能制造、智能驾驶等领域的应用。
安徽省人形机器人产业创新中心获批,将打造国内首创、世界领先研究基地:
该创新中心由江淮前沿技术协同创新中心牵头,联合中科大先研院、合肥工业大学、科大讯飞、蔚来汽车科技(安徽)有限公司等 13 家单位建设产业创新平台,针对人形机器人多模态感官感知融合等技术难题,重点突破一体化关节模组研制、强健肢体、智慧大脑、敏捷小脑等关键技术,形成全链条发展。江淮前沿技术协同创新中心依托清华大学智能机器人团队建立人形机器人研究中心,已搭建研发体系,“启江一号”正在进行联调联试。
亳州市与华为公司合作打造华佗中医药大模型:
合作将充分利用华为算力、算法优势,亳州中医药政策、区域、资源、数据优势,打造首个中医药产业大模型——华佗中医药大模型。
自然语言处理招聘职位数增超120%,平均月薪达24535元:
智联招聘数据显示,今年一季度,自然语言处理工程师的招聘职位数同比增速高达惊人的126%。与此同时,平均月薪达到24535元,较去年同期增长了12%。从地域分布来看,北上广深作为AI人才和商业化的聚集地,对NLP工程师的需求尤为旺盛。
百度网盘自研短剧AI看,1分钟看50集:
百度网盘宣布自研“短剧AI看”,支持短剧分集智能总结,1分钟轻松看50集,支持智能添加字幕,中英日韩四国语言灵活切换,支持数小时的长视频解析,15秒即可实现对5小时内视频内容快速总结。
B站CEO陈睿称每月超过8000万用户在平台看AI内容:
B站董事长兼CEO陈睿公布了AI在B站上的内容消费趋势。2023年,B站AI相关内容的日均视频播放量同比增长超过80%,每个月有超过8000万用户在B站看AI,AI相关内容消费人群中有60%为00后。
赵明称荣耀手机在端侧 AI 方面要整体领先于苹果:
荣耀 CEO 赵明表示,过去三年荣耀一直重点投入 AI,刚开始是打基础的,现在逐渐呈现出来。他提到,荣耀与苹果竞争走出了独特的差异化路线,在端侧 AI,荣耀要整体领先苹果,也看到了苹果的快速反应能力和纠错能力。“我们非常尊敬苹果,荣耀也要拿出自己的能力。”他还透露,荣耀端侧 AI 能力和服务未来会也将面向海外发布。
国际情报:
Claude推类GPTs功能Projects,可创建特定项目的个性化机器人:
Claude 允许用户将聊天组织成 Projects 项目,集中管理知识集合和聊天活动,可帮助团队成员共享最佳聊天记录,促进创意生成、战略决策和卓越成果。Porjects 功能使用户可以将Claude的输出与内部知识结合,例如风格指南、代码库、访谈记录或过去的工作,从而提供专业协助。用户可以为每个项目定义自定义指令,以进一步定制Claude的响应。
AI 助推亚马逊跻身“2 万亿美元俱乐部”:
亚马逊公司市值首次突破 2 万亿美元门槛,继微软、苹果、英伟达、Alphabet之后,成为第五家加入“2 万亿美元俱乐部”的美国公司。
谷歌 YouTube 希望与唱片公司合作共创 AI 音乐,Google翻译新增110种语言支持:
据悉,YouTube 准备在今年推出新 AI 工具,目前正在与唱片公司谈判,希望获得歌曲版权以训练 AI,目前已向索尼、华纳和环球等唱片公司提供了大笔现金。
此外Google官方表示,翻译服务将增加对 110 种语言的支持。该公司利用其 PaLM 2 人工智能模型为翻译提供支持,这些新增语言的使用者超过 6.14 亿,约占总人口的 8%。
Hugging Face更新排行榜评估规则, CEO称阿里Qwen-2成全球开源大模型排行榜第一:
Hugging Face最新更新的Open LLM Leaderboard提供更严格、更细致的评估,解决大语言模型性能提升停滞问题。更新包括引入更具挑战性的数据集、实施多轮对话评估等内容。
此外Hugging Face CEO Clem称,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名,力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。
微软推出最新视觉基础模型Florence-2:
该模型采用 Transformer.js 技术,支持在 WebGPU 浏览器中离线本地运行,加载后可断网使用,功能包括图像描述生成、OCR、物体检测和图像分割,有 2.3 亿参数,模型大小为 340MB,ONNX 模型已开放获取,源代码也公开在 GitHub 上。
新型 AI 算法亮相,功率降至常规配置 1/50,显存占用降至 1/10:
美国加州大学圣克鲁兹分校开发了新型 AI 算法,能够在 13W 功率下运行 10 亿参数规模的大语言模型,作为对比,用于大语言模型任务的数据中心级 GPU 需要约 700W。在定制硬件上运行时,该神经网络的功率仅为常规配置的五十分之一,与顶级模型性能相同。在标准 GPU 上运行时,相比于基于矩阵乘法的神经网络,显存占用仅为十分之一。
AI“早筛”癌症最新研究,准确区分13种癌症,准确率98.2%:
伦敦帝国理工学院和剑桥大学的研究团队训练了EMethylNET模型,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症,准确率高达 98.2%。该模型依赖于组织样本,目前还处于实验阶段,需要对更多样化的活检样本进行额外的训练和测试,方可进一步用于临床。
AI生成内容检测工具DIVID,准确率达 93.7%:
哥伦比亚工程大学的研究团队开发DIVID,专门用于检测由扩散模型生成的视频,如 OpenAI 的 Sora、Runway Gen-2 和 Pika 等。DIVID 利用 DIRE技术,通过比较输入视频与预训练扩散模型重建输出之间的差异来识别 AI 生成内容。开源代码和数据集已开源。
视频编辑应用Captions发布AI编辑功能,自动为视频添加特效:
该功能可自动添加特效,包括自定义图形、缩放、音乐、音效、转场和动态背景,但 AI 编辑功能仅适用于竖向的单人讲话视频。用户也可使用 AI 角色创建视频,并输入 AI 编辑功能获得完整编辑视频。
Viggle推出Move功能,可保留照片的原始背景:
Viggle近日推出全新功能"Move",为用户提供简单有趣的方式为静态照片添加动画效果。这一创新功能保留照片原始背景,易于访问且无需复杂编辑。
未来五年 AI 芯片将消耗全球超 1.5% 电力,产生超 10 亿吨碳排放:
TechInsights 预测,2023 年至 2029 年间,数据中心 AI 芯片和加速器的出货量将以 33% 的年复合增长率增长,年出货量将达到 3300 万。据估计,2025 年至 2029 年间销售的数据中心加速器在其使用寿命内持续使用,总功耗可达 2318 太瓦时,占全球电力消耗的 1.5%。AI 芯片将产生 11 亿吨二氧化碳排放,每年需要约 500 亿棵成熟树木来吸收这些排放。
Omdia预计2024年生成式AI软件市场将增长124%:
Omdia最新发布的《人工智能软件市场预测》显示,生成式人工智能(GenAI)软件收入将从 2023 年开始以 53% 的复合年增长率增长,到 2028 年达到 580 亿美元。2024 年 GenAI 软件收入将增长 124%,比之前预测的 100%有所上调。
黄仁勋称AI新一轮浪潮预计将使价值50万亿美元的重工业实现自动化:
在英伟达 2024 年股东大会上,黄仁勋 2024 财年薪酬增长 60%,达 3400 万美元。会议批准了黄仁勋在内的 12 位董事提名,通过了高管薪酬方案;普华永道继续担任独立注册会计师事务所。
黄仁勋表示,新一轮人工智能浪潮预计将使价值50万亿美元的重工业实现自动化。英伟达将重心从游戏移至数据(AI),并寻求为 AI 创造新市场,如工业机器人等领域。 Blackwell 可能是英伟达史上最成功的产品,将被各大云服务提供商、服务器行业和头部 AI 企业所采用。
微软AI负责人称未来知识生产成本将降到边际成本为零:
谈及AI公司训练模型过程中涉及的版权问题,微软AI首席执行官Mustafa Suleyman表示,对于许多开放网络上的内容,默认的社会契约是允许这种使用的。苏莱曼认为,信息经济学即将发生根本性的变化,“因为我们将把知识的生产成本降低到边际成本为零。”
Product Hunt 热榜,AI视频创作平台 Zebracat.ai
Zebracat.ai是一款创新型AI视频创作平台,能将文本快速转化为高质量营销视频。用户可选择自有素材、AI生成内容或库存素材,提升内容创作效率。该平台以其快速、低成本和高参与度的特点,为广告创作、内容转化和社交媒体营销等多种商业场景提供解决方案。Zebracat.ai提供多层次定价计划,并开放免费试用。
?https://www.zebracat.ai/?ref=producthunt
GitHub Trending 热榜,开源AI引擎推动智能文档处理RAGFlow
RAGFlow是一款开源检索增强生成引擎,专注于深度文档理解和智能问答。它能从多种复杂格式的未结构化数据中提取知识,结合大型语言模型提供高精度的问答服务。支持广泛的数据源,包括办公文档、图片、扫描件和网页等,提供自动化的RAG工作流程。
该引擎的核心优势在于其模板化分块方法、基于证据的引用系统,以及对异构数据源的兼容性。RAGFlow提供灵活的配置选项,支持多种LLM和嵌入模型,以及多样化的召回和融合重排方法。通过Docker快速部署,加上直观的API设计,RAGFlow极大地简化了AI驱动的文档处理和问答系统的实现过程。
?https://ragflow.io/
开发者推荐
1.Figma AI和Figma Slides:设计师的超级助手
Figma从纯粹的设计工具向全面的产品开发平台的转型。Figma AI引入了四个革命性功能:自然语言UI创建、智能视觉搜索、一键原型生成和工作流程自动化。
Figma 推出了 Figma Slides,这是一个设计和演示工具。目前处于公测阶段,用户可以免费体验,结合 Figma AI 使用可以扩展 Figma 的应用范围。提高设计师的工作效率,为产品开发流程带来新的可能性。
?https://www.figma.com/blog/introducing-figma-ai/
?https://www.figma.com/slides/
2.Scene.io: 网站设计界工具
Scene.io 推出全新一站式网页设计平台,整合从创意构思到网站发布的全过程。核心特色包括内置 AI 助手 Muse,协助用户进行网站规划、竞争对手分析、线框图生成和内容创作。平台支持团队协作,提供直观工具方便非设计师参与,并采用响应式设计块实现快速开发。该平台目前免费使用,计划于 2024 年 10 月推出付费版本。
?https://www.scene.io/?ref=producthunt
3.LeptonAI开源AuraSR:图片高清修复,可放大4倍并补充细节
AuraSR 是基于 GAN 的上采样模型,拥有 6 亿参数,源自 GigaGAN 论文,可用于放大和补充细节,支持多次放大,适用于写实和非写实风格,基于 Torch 框架实现,只需几行代码即可完成图片加载和放大。
作为一个基于 GAN 的模型,它能在单次前向传播中完成图像生成,比传统的扩散模型快得多。例如,AuraSR 仅需 0.25 秒就能将图像放大到 1024px(4 倍上采样)。此外,该模型特别擅长处理文本到图像模型生成的图像,没有分辨率或上采样因子的限制。
?https://blog.fal.ai/introducing-aurasr-an-open-reproduction-of-the-gigagan-upscaler-2/
4.LinkRobot:AI驱动的SEO内链优化利器
LinkRobot 是一款专为提升 WordPress 网站 SEO 性能而设计的 AI 自动内部链接工具。它通过智能爬虫技术收集网站现有内部链接数据,并运用 AI 算法为每个 URL 推荐最优的锚文本关键词。这款工具能自动识别内链添加机会,并通过 WordPress 集成实现一键式批量添加。
LinkRobot 提供多层次的定价方案,以满足不同规模网站的需求。旨在帮助网站提高搜索引擎排名,增加用户停留时间,从而提升整体 SEO 表现。
?https://linkrobot.ai/
5.LeCun谢赛宁开源视觉多模态模型,等效1000张A100干翻GPT-4V:
LeCun 和谢赛宁团队共同提出全新的SOTA MLLM:Cambrian-1,开创了以视觉为中心的多模态模型设计方法,并开源了模型权重、代码、数据集和评估方法,旨在提升视觉表征能力,并可能成为未来智能助手的基础。
研究团队提出了新型空间感知连接器和空间视觉聚合器,有效整合多种视觉编码器的特征,显著提升了模型性能。项目还构建了大规模指令调优数据集Cambrian-10M,并引入新的视觉中心基准测试CV-Bench,为评估多模态模型提供了新标准。通过创新的两阶段训练策略和多视觉编码器的结合,Cambrian-1在多个基准测试中展现出卓越性能,甚至与一些专有模型相媲美。
?https://cambrian-mllm.github.io/
大牛洞见
尼古拉·唐根深度访谈Anthropic创始人CEO Dario Amodei:
该访谈探讨了人工智能技术的最新突破和发展趋势,以及 Anthropic 公司在其中扮演的角色。
Dario 介绍了 Claude 模型的特点和优势,以及公司未来的发展方向。他认为 AI 模型的能力正在呈指数级增长,可解释性是 AI 模型发展的重要方向,合成数据技术的突破有望打破 AI 训练的数据瓶颈,AI芯片的快速迭代将推动模型性能的持续提升。
在 AI 技术可能带来的影响方面,他指出 AI 在生物医药、教育、政府服务等领域有望带来革命性的进步,但同时也可能加剧贫富差距,对地缘政治和国家安全产生重大影响,AI系统的自主性风险和潜在的灾难性需要引起高度重视。
在 AI 治理方面,他支持以企业自愿自律为主、政府适度监管为辅的分阶段治理路径,主张在全球范围内建立 AI 竞争中的“向上竞争”机制,鼓励负责任和符合伦理的 AI 开发,认为民主国家应在 AI 领域保持领先优势。
最后,Dario 还分享了 Anthropic 的企业文化理念,强调简单有效、人才至上、公共利益导向等价值观,建议年轻一代要熟悉新兴 AI 技术,保持独立思考和判断力。
? https://www.bilibili.com/video/BV1am421V71m/?p=1
敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。