融资快报
Runway 正洽谈新一轮 4.5 亿美元融资,估值达 40 亿美元:Runway 正在与 General Atlantic 洽谈新一轮 4.5 亿美元融资,估值达 40 亿美元。2023 年 6 月,Runway 曾从包括 Google、Nvidia 和 Salesforce Ventures 在内的投资者那里筹集了 1.41 亿美元,当时的估值为 15 亿美元。据悉,Runway 在去年年底的 ARR 约为 2500 万美元,比六个月前的几百万美元大幅增加,但仍与 OpenAI 等头部玩家三四十亿美元的收入有较大差距。
Magic 正洽谈 2 亿美元融资,估值 15 亿美元:美国AI编程创企Magic正在谈判筹集超过2亿美元的一轮融资,估值为15亿美元。 包括Jane Street在内的投资者预计将参与这一轮融资,这可能会使Magic的估值比上一轮高出3倍,尽管该公司没有收入,也没有产品出售。
Sentient获8500万美元种子轮融资:总部位于美国旧金山的人工智能研究与开发初创公司Sentient宣布筹集了8500万美元的种子轮融资。本轮融资由彼得·蒂尔的Founders Fund、Pantera Capital和Framework Ventures共同领投。Sentient致力于通过建立开放平台,确保AI技术的发展符合全人类的利益,并使AI的好处能够公平分配。
K Health获5000万美元融资:K Health 开发了一种临床级 AI copilot,可以改变初级保健体验。由Claure Group 领投。
Phaidra获1200万美元新一轮融资:利用AI管理数据中心能源消耗的初创公司Phaidra宣布筹集了1200万美元的新一轮融资,本轮融资由Index Ventures领投。
VersaTile Automation 筹集1000万美元的种子资金:VersaTile Automation是人工智能驱动的仓库自动化公司。
Redactive筹集1150万美元融资:Redactive是澳大利亚人工智能工程和安全开发初创公司,提供 "虚拟人工智能工程师",使开发人员无需学习、实施和维护专业数据工程知识,即可为客户或生产力用例构建可扩展且安全的人工智能增强型应用。Felicis Ventures 和 Blackbird Ventures Pty.Ltd.领投,Atlassian Ventures LLC 和 Zapier Inc.跟投
Synthpop 筹集560万美元种子资金:用于医疗保健管理任务的 AI 代理。
Helical获240万美元融资:Helical提供了一个开源 AI 平台,用于集成和评估 DNA 和 RNA 基础模型。他们的平台通过简化在遗传数据上训练的LLM的集成,使研究人员能够构建和部署广泛的药物发现应用程序。由Frst领投。
钛虎机器人完成数千万元Pre- A轮融资:本轮融资由经纬创投领投,方富创投和梅花创投跟投。 融资资金将用于人形机器人标准系列关节矩阵拓展及产品底层技术研发。
(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
国内情报:
腾讯 AI Lab 实验室主任换帅,蒋杰接任张正友:
张正友,腾讯公司的首席科学家,同时也是腾讯AI Lab(腾讯人工智能实验室)及Robotics X实验室的主任。接任该职位的蒋杰,目前是腾讯集团副总裁,腾讯企业发展事业群(CDG)副总裁兼技术工程事业群(TEG)副总裁。同时,蒋杰也是腾讯混元大模型的负责人。
百度智能云千帆AppBuilder升级,支持数字人Agent和10万字长文档解析:
新增长文档内容理解组件,能够解析长达10万字的文档,支持信息检索、摘要总结和文本分析,极大提升了阅读和分析效率。新版本还引入了数字人Agent,支持配置3D数字形象,并通过语音对话及语言驱动的口型、表情和动作,使应用交互更加真实和沉浸。支持将应用发布到微信小程序及个人公众号。
腾讯造10亿虚拟人格专搞数据合成,让7B模型数学成绩打平GPT4:
腾讯利用网络数据制造包含 10 亿个不同人格信息的 Persona Hub。这些不同人格生成了 107 万条数据,并用其训练了 Qwen2-7B 模型。在 MATH 数据集上进行测试后,模型获得了 64.9%的准确率,比原始版本提高了 15 个百分点,并与 GPT4-Turbo 的两个版本打成平手。使用虚拟人格生成的数据不仅可以用于数学训练,还能支持工具开发和游戏 NPC 创建。
腾讯翻译智能体公司TRANSAGENTS上线:
TRANSAGENTS是腾讯AI实验室开发的专门用于进行文学翻译的多智能体虚拟翻译出版公司,通过模拟真实翻译公司的虚拟角色合作模式,实现流畅高效的文学作品翻译。使用TRANSAGENTS进行文学翻译的成本比专业人类翻译员低80倍,且在领域特定知识需求下表现超越人类翻译。
参数少80%,效果仍超LoRA,高效微调框架FLoRA:
上海交通大学和上海 AI 实验室研究人员提出了一种名为 FLoRA 的高效微调框架,该框架能在减少 80% 参数的同时,在视觉任务上取得与 LoRA 相同的效果,通过 Tucker 分解实现对 N 维张量的低秩微调,保留了原参数不同维度之间的拓扑关系和交互性。
国际情报:
近三个月,投资者已向美国AI初创公司注资 271 亿美元:
PitchBook数据,从4月到6月,投资者向美国的人工智能初创企业投入了271亿美元,占同期美国所有初创企业资金的近一半。美国初创企业总共筹集了560亿美元,比去年同期增长了57%,是两年来最高的三个月。人工智能初创公司吸引了大量资金,成为当前创投低迷的强劲反击力量。
苹果公司有望获得 OpenAI 董事会观察员席位:
苹果公司将获得OpenAI董事会观察员职位,这进一步加强了两家公司之间的联系。据知情人士透露,苹果应用商店负责人、前营销主管Phil Schiller被选中担任这一职位。这位知情人士说,作为董事会观察员,他不会以正式董事的身份任职。
Meta 发布 3D Gen AI 模型,1 分钟内生成高质量 3D 内容:
Meta 发布研究论文,介绍了名为 Meta 3D Gen的全新 AI 模型,可以在 1 分钟内基于用户输入的提示词,生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen所生成的 3D 内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染,并能对此前生成的 3D 内容重新再生成新纹理。
AI 音乐和歌曲生成平台 Suno 推出 iOS 移动端 APP:
Suno已有超过1200万人使用,目前推出了首款iOS设备移动应用程序。Suno iOS 版允许用户只需提供文字描述或用手机录制音频,就能轻松创建自己的音乐。用户可以生成 4 分钟长的歌曲和 2 分钟长的歌曲扩展。
微软开源GraphRAG,构建知识图谱增强大模型的问答、推理等能力:
该系统通过构建实体知识图谱来增强大模型的搜索、问答、摘要、推理等能力,特别擅长处理大规模数据集。微软在一个100万 tokens、超复杂结构的数据集上,对 GraphRAG 进行了综合测试,结果显示 GraphRAG 在全面性和多样性测试上,超越了 Naive RAG 等方法,且在播客转录和新闻文章数据集上都显示出了超高的水准,是目前最佳的 RAG 方法之一。
甲骨文推出HeatWave GenAI 提供数据库内大语言模型等功能:
该产品旨在为企业提供全面的生成式AI和机器学习解决方案。该服务集成数据库内大语言模型,使其能够在交易和湖仓规模的分析中实现自动化。核心优势在于其accessibility和ease of use。企业客户无需具备AI专业知识,也无需进行复杂的数据迁移,就能将生成式AI技术应用于自身数据。这项服务将立即向现有HeatWave客户开放,且不收取额外费用。
宝马汽车工厂迎来新员工,Figure 01 人形机器人已开启“车间实习”:
Figure 官方发布视频,展示了其机器人在生产车间进行简单抓取工作的最新成果。Figure 01 机器人能够将汽车框架放置在夹具上,并且能够自主识别和纠正抓取错误。
纳米机器人杀死癌细胞,肿瘤生长抑制70%:
瑞典卡罗林斯卡学院的研究团队创造了一种 DNA 纳米机器人,这种机器人能够在肿瘤微环境中精确杀死癌细胞,并在小鼠实验中有效减少了肿瘤生长 70%。该研究发表在《自然纳米技术》期刊上。纳米机器人的核心突破在于其三维 DNA 折纸设计,该设计使得机器人对 pH 敏感,能自主运作,并且在正常生理条件下保持惰性,不会对健康细胞造成伤害。
40多年「忙碌海狸」数学难题获突破,4万行Coq代码立大功:
忙碌海狸难题,一直困扰计算机科学界 40 多年,最近由全球 20 多位业余爱好者和数学家团队取得了突破,利用 Coq 证明助手确定了第五个忙碌海狸的数值为 47176870,这一成就得到了陶哲轩的转赞,体现了证明助手在数学研究协作中的重要性。
Meta 首席技术官称Meta首款 AR 眼镜将是一台“时间机器”:
Meta 首席技术官 Andrew Bosworth表示 “这是一款全功能 AR 眼镜,拥有清晰的显示效果和宽广的视野。目前仅供内部使用,仍在原型阶段。它就像一台通往未来的‘时间机器’,第一次戴上它是我职业生涯中最酷的事情之一。它令人惊叹,凝聚了我们多年来的努力和巨额投入。” Bosworth 补充道,“现在我们拥有了开发者平台,可以开始构建软件、体验并直观感受全功能增强现实的不同输入模式,这正是我们一直在努力打造的未来。”
黄仁勋称未来职场会更卷 AI可以充当“员工”:
黄仁勋指出,随着AI技术的日新月异,拥有强大推理能力的智能体正逐步蜕变为职场中的“超级员工”,不仅能够高效处理复杂多变的任务,更在特定领域内展现出超越人类的卓越能力。黄仁勋坚信未来的AI将迈向“多轮推理”(multi-shot)的新纪元,这意味着AI将能够像人类一样,在复杂情境中进行多步骤、深层次的思考与规划。
更多国际情报:
AI 发展代价高昂,谷歌温室气体排放量过去 5 年增长近 50%:“随着我们将更多 AI 技术融入产品,预计未来排放量将因基础设施投资增加带来的能源需求而居高不下,实现减排目标面临挑战,”谷歌发布的 2024 年环境报告中写道。
美国芯片业重大缺口,拜登政府准备砸钱补救:拜登政府启动劳动力伙伴联盟计划,以培养美国计算机芯片劳动力,并利用新国家半导体技术中心预留的 50 亿美元联邦资金,以解决劳动力短缺问题,促进美国芯片制造业的发展。
因生成的设计太像苹果天气 App,Figma AI 设计工具被迫下线:Figma首席技术官表示,“生成设计” 功能的 AI 模型由 OpenAI 的 GPT-4o 和亚马逊的 Titan 图像生成器 G1 提供支持,并指出 Figma 并没有负责训练其所使用的任何 AI 模型。
Product Hunt 热榜,Motiff.AI
Motiff是一款融合AI技术的专业UI设计工具,通过AI Toolbox、AI Design Systems和Motiff Lab等功能,为设计师提供智能化的设计辅助,包括自动布局、设计系统生成和维护等。
该工具提供了从设计到开发的全流程支持,包括云协作、原型制作和专为开发者设计的Dev Mode。Motiff采用阶梯式定价策略,从免费版到团队协作版,满足不同用户需求。其自研渲染引擎和优化结构保证了卓越的性能和稳定性,为设计工作提供强有力的技术支持。
?https://www.motiff.com/?ref=producthunt
GitHub Trending 热榜,AI代理的开发langgraph库
LangChain Inc 推出的 langgraph 库为开发者提供了构建基于图的、弹性语言代理的新工具。它支持循环、可控性和持久性,处理包含循环的流程,能对流程和应用状态进行精细控制,特别适合创建复杂的代理和多代理工作流程。
该库受到 Pregel 和 Apache Beam 的启发,在设计上强调灵活性和可靠性。langgraph 内置了持久性功能,支持错误恢复和人工介入,并与 LangChain 无缝集成。通过提供全面的文档和教程,langgraph 帮助开发者轻松构建和部署复杂的语言代理应用。
?https://github.com/langchain-ai/langgraph
开发者推荐,跨平台无损视频编辑工具LosslessCut
LosslessCut是一款开源的跨平台视频/音频编辑工具,利用FFmpeg提供快速无损的剪辑功能。支持多种常见媒体格式,适用于macOS、Windows和Linux系统。用户可以通过GitHub免费下载,也可从应用商店购买。
该软件不仅提供基础的无损剪辑功能,还支持高级多步工作流程、命令行界面和HTTP API。开发者Mikael Finstad独立维护这个项目。LosslessCut的设计理念强调在保持原始质量的同时,为用户提供高效的媒体处理解决方案。
?https://github.com/mifi/lossless-cut?utm_source=uwl.me
前沿技术
1.微软推出免费AI入门课程,18节课玩转生成式AI!
微软云倡导者团队推出开源课程"generative-ai-for-beginners",帮助初学者迈入AI世界。这18节课程涵盖了从AI基础到实际应用,包括大型语言模型介绍、提示工程、应用构建等热门话题。
课程采用多媒体教学方式,提供视频、教程和代码示例,适合有基础编程知识的学习者。除了使用Azure OpenAI服务,课程还涉及OpenAI API、Hugging Face等工具。
?https://github.com/microsoft/generative-ai-for-beginners
2.低显存开源TTS模型Fish Speech,支持音色克隆:
Fish Speech是一款由fishaudio开发的全新文本转语音工具,基于深度学习的语音合成项目,支持中英日三种语言,语音处理接近人类水平,使用Flash-Attn算法处理大规模数据。项目提供详细的安装和使用指南,支持 Windows 和 Linux 系统。
?https://github.com/fishaudio/fish-speech
?https://speech.fish.audio/
3.PowerPaint:多功能图像修复
清华大学和上海人工智能实验室联手推出的PowerPaint模型,通过创新的可学习任务提示和专门的微调策略,成功解决了高质量多功能图像修复的难题。它不仅能根据用户意图精准填充指定区域,还支持物体移除、形状指导修复等高级功能,在多种任务中展现卓越性能。研究团队计划开源代码和模型。
?https://github.com/open-mmlab/PowerPaint
4.ScreenPipe:用LLM将屏幕转化为动作
LLM 能将屏幕转化为一系列的动作,用户可通过简单的编程语言将屏幕上的动态信息转化为操作,进而执行各种复杂的操作,是一种全新的交互方式。该软件已开源,在GitHub Repo上发布。
?https://github.com/louis030195/screen-pipe?utm_source=uwl.me
5.Vision Agent开源:专注解决视觉任务
Vision Agent是一个强大的库,旨在利用代理框架生成代码,以解决视觉任务。该库可用于各种需要处理图像和视频的应用场景,包括但不限于计算机视觉、机器学习、人工智能等领域。借助Vision Agent,用户可以轻松地创建和训练Agent,让它们能够理解和解析图像数据,从而完成各种复杂的视觉任务。。
?https://github.com/landing-ai/vision-agent?utm_source=uwl.me
热议话题
艺术家"涂黑"名作,向 AI 侵权宣战
著名艺术家迈克尔・福布斯抗议 AI 对艺术界的负面影响,他在自己的四幅知名作品上用黑色油漆 "审查" 了部分内容,包括约翰・列侬和泰勒・斯威夫特的肖像画。这一事件引发了对 AI 伦理和艺术版权的广泛讨论,凸显了在 AI 技术快速发展的背景下,如何在鼓励创新与保护艺术家权益之间寻找平衡的迫切性。艺术界、科技界和立法机构需制定相关规范和法律,以应对这一挑战。福布斯的抗议行为,提醒我们在拥抱技术进步的同时,也要警惕其可能带来的负面影响。
?https://www.bbc.co.uk/news/articles/clwyvqw3wx9o
敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。