融资快报
剂泰医药完成1亿美元C轮融资:剂泰医药是专注“AI+药物递送”的创新型生物技术公司,本轮融资由中金资本旗下基金领投,中国太平旗下太平香港保险科创基金跟投。此前已获得的红杉中国、国寿股权、人保股权、五源资本、峰瑞资本、源码资本、光速光合、砺思资本等顶尖投资机构投资。
久痕科技获得数千万元种子轮投资:久痕科技是一家关注知识工作的人工智能开发商,公司的第一款产品是以个人数据为中心的通用办公助理。
Iambic Therapeutics获5000万美元B+轮融资:Iambic Therapeutics(前身为 Entos)是一家人工智能医疗平台开发商。由新投资者 Mubadala Capital 和 Exor Ventures 领投,卡塔尔投资局以及老股东Abingworth、Illumina Ventures、Nexus Venture Partners、Coatue 和 Tao Capital Partners 参投。
两名05后高中生联手打造 API 初创,已获 50 万美元融资:两位年仅 18 岁的美国高中毕业生Christopher Fitzgerald 和 Nicholas Van Landschoot,共同创立了 APIGen。目前筹集了 50 万美元投资,投资公司是丹佛的 Varana Capital。该平台将通过自然语言提示建立定制化的 API,并将在本月发布一个测试版。
(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
国内情报:
OpenAI终止对中国提供API服务,智谱AI等国产大模型第一时间提供“搬家计划”:
OpenAI官网信息显示,自7月9日起,OpenAI将终止对中国大陆提供API(应用程序编程接口)服务。国产大模型快速发布应对方案,智谱bigmodel.cn 推出 OpenAI API 用户特别搬家计划,轻松切换至国产大模型。智谱GLM 大模型全面对标 OpenAI 产品体系,全链路技术自研、安全可控。
为开发者提供:1.5亿 Token(5000万 GLM-4 + 1亿 GLM-4-Air);从 OpenAI 到 GLM 的系列迁移培训。
为高用量客户提供:与 OpenAI 使用规模对等的 Token 赠送计划(不设上限);与 OpenAI 对等的并发规模;匹配高等级会员政策;专属搬家顾问及5人天技术专家支持;备案培训和辅助。
字节跳动回应与博通合作开发5nm AI芯片:
有消息称字节跳动为削减采购成本并确保高端 AI芯片供应稳定,正与美国博通合作开发先进 AI 处理器。字节跳动回应称该消息不实。
科大讯飞获 2023 年度国家科学技术进步奖一等奖;与华为音乐达成全面深度合作:
科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化项目,获得国家科学技术进步奖一等奖。这是 2012 年深度学习引发新一代人工智能浪潮以来,人工智能领域首个国家科学技术进步奖一等奖。
此外,华为音乐与科大讯飞将基于 HarmonyOS 发展面向全场景时代的新生态,在已有的音乐内容发行、艺人合作、手机铃音 AI 创作等方面展开更加深入的合作。
阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场:
通义灵码个人专业版为限免阶段,所有用户均可享受个人专业版服务,限免期结束后,对所有开发者免费提供个人基础版服务,限免周期暂未确定。
阿里和华东师大推出AI合成视频后调优技术ExVideo、视频转卡通风格的框架Diffutoon:
ExVideo能够扩展现有视频合成模型的时间尺度,以生成更长和帧数更多的视频。该团队基于Stable Video Diffusion模型,训练了一个能够生成长达128帧连贯视频的扩展模型,同时保留了原始模型的生成能力。
Diffutoon基于扩散模型的可编辑卡通着色技术,能够将真实感视频转换成动漫风格。Diffutoon能够渲染细节丰富、高分辨率、长时间视频,并可通过附加分支根据提示编辑内容。
零一万物登陆阿里云百炼平台:
零一万物首次通过云厂商提供API服务,结合阿里云完备的工具链和丰富的云上算力资源,满足企业级需求。模型包含旗舰模型Yi-Large、高性价比模型Yi-Large-Turbo、支持实时搜索的Yi-Large-RAG以及适合日常通用场景的中等尺寸模型Yi-Medium。均提供限时免费调用额度。
图像动画技术的新突破MOFA-Video:
由杉杉茂茂大学和腾讯人工智能实验室研究人员提出的 MOFA-Video,通过在冻结的视频扩散模型中使用适应的运动,实现了基于轨迹和关键点的图像动画。该技术支持混合控制、运动画笔和光流控制等零样本功能,并进行了 MOFA-Adapter 架构的消融研究和领域特定调优。
南大与旷视研究院联手破解视觉大模型对齐难题:
他们推出的无监督范式SeVa,成功解决了视觉语言模型的偏好对齐问题,而且整个过程无需人类或GPT-4标注,大大降低了对齐成本,仅使用8k构造的无监督数据,就显著提升了VLM的指令遵循能力,降低了幻觉。这项技术的核心在于自动化构造偏好数据的pipeline,通过对比偏好对齐前后的模型输出,可以明显看出变化。
国际情报:
Nature研究称语言≠思维,大模型学不了推理:
《Language is primarily a tool for communication rather than thought》表明人类大脑的语言网络与形式化推理分离,语言主要是交流工具,而不是思考的媒介。研究通过 fMRI 等成像技术观察了大脑中语言区域的活动,发现语言网络支持语言理解和生成,对词义和句法结构有敏感性,但并非是思维的基础。即使在语言能力受损的情况下,人们仍能进行多种形式的推理,包括数学问题解决、执行规划和遵循非言语指令等。完整的语言系统并不意味着完整的推理能力,反之亦然。
研究发现 GPT-4o 的道德推理能力已比专家更强:
研究中 501 名美国成年人对 GPT-3.5-turbo 模型提供的道德解释表现出更高的认可度。另一项研究中,GPT-4o 生成的建议在 50 个 “伦理困境” 的评分中,几乎在所有方面都优于了著名伦理学家 Kwame Anthony Appiah 的建议。尽管 AI 在道德推理方面表现出色,但研究人员提醒谨慎对待其建议,并指出未来需要进一步研究以探讨不同文化背景下人们对 AI 生成的道德推理的接受度。
牛津研究人员利用语义熵来识破 AI“幻觉”:
该研究已发表在《自然》杂志,研究员提出了利用语义熵来检测大型语言模型的 “捏造” 问题的方法。该方法不需要额外的监督或强化学习,可以快速识别 LLMs 的 “幻觉” 问题,即使是在面对未知任务时也能应用,从而提高用户对 LLMs 的信任。这种方法能帮助用户判断何时需要对 LLMs 的输出保持谨慎,并为 LLMs 的应用开辟新的可能性。
将 AI 用于车辆初步检查,一分钟内可生成全面报告:
已有 300 家经销商采用 AI 系统进行车辆初步检查,该系统可拍摄车辆照片并检测外部、轮胎和可见机械部件的缺陷,快速生成报告,帮助技术人员及时发现并解决潜在问题,确保汽车安全。尽管 AI 系统可能会揭示未知缺陷导致额外成本,但提前发现问题比后续处理更为有利。
F1将与亚马逊联合推出AI“Statbot”数据机器人,提供个性化观赛体验:
“Statbot”在巴塞罗那站比赛期间利用亚马逊 AWS 云计算部门的技术,搜索比赛档案并解析大量实时赛车数据,向现场直播主持人提供背景信息与趣闻。
英伟达将在中东五国数据中心部署 AI 技术:
英伟达首次在中东地区大规模推出产品,Ooredoo 将成为该地区首家能够为其数据中心客户提供直接访问英伟达 AI 和图形处理技术权限的公司。此前,华盛顿曾限制向该地区出口美制尖端芯片。 5 个中东国家包括卡塔尔、阿尔及利亚、突尼斯、阿曼、科威特。
美国零售巨头将在2000家门店引入生成式AI聊天机器人:
Target Corporation将在全美近2000家门店推出一款名为 “Store Companion” 的生成式人工智能工具。这一 AI 聊天机器人旨在提高运营效率,提升购物体验,并成为 Target 超过40万员工的多面助手。除了改善员工工作效率,Target 还计划利用生成式人工智能改进产品描述和客户评论总结,为顾客提供更加精准、简洁的购物信息。
全球前20%的AI人才中国独占47%!韩国仅2%:
根据芝加哥大学保尔森研究所最新数据,中国在 AI 研究领域的顶尖人才数量已经几乎赶超美国。在2022年全球排名前 20%的 AI 研究人员中,中国占了 47%,而韩国仅占 2%。在排名前 2%的 AI 研究人员中,美国占 28%,中国占 26%,相较于 2019 年的 10%有了显著提升。
更多国际情报:
《Python 机器学习》作者新作,从头开始构建大型语言模型,代码已开源:《Build a Large Language Model (From Scratch)》旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。最近,Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。
多家 AI 公司被曝绕过网络标准抓取新闻出版商网站内容:专注于“内容许可”领域的初创公司 TollBit 警告称,多家 AI 公司规避网络标准抓取内容并用于训练生成式 AI 系统。一些出版商已起诉 AI 公司,而其他则签署了许可协议。许多 AI 开发者认为他们的行为并未违法。
大众汽车海外新车搭载ChatGPT,智能交互功能全面升级:包括语音助手控制信息娱乐、导航和空调系统,以及提供旅游景点信息、足球比赛报道等服务。该功能目前仅限于海外车型使用。
Product Hunt 热榜,面向 SQL 用户的AI协作资源库Sherloq
Sherloq 是一个为 SQL 用户设计的协作性人工智能资源库。它是一个 Chrome 扩展程序,属于生产力和开发者工具类别,旨在帮助用户更高效地编写和优化 SQL 查询。Sherloq 通过提供智能化的代码助手和资源,使得数据库查询和管理变得更加简便。
?https://www.sherloqdata.io/?ref=producthunt
GitHub Trending 热榜,Build your own X
Build your own X旨在从零开始重构最喜欢的技术,帮助开发者更深入地理解并掌握编程。该项目由 Codecrafters, Inc. 管理,目前拥有超过 277k 个星标和 26.1k forks。提供了多种技术的构建指南,包括机器人、神经网络、操作系统、物理引擎、编程语言、视觉识别系统等。这些指南覆盖了多种编程语言,包括 C、C#、C++、Go、JavaScript、Python、Ruby、Rust 等。
?https://github.com/codecrafters-io/build-your-own-x
开发者推荐
1.LlamaIndex 推出全新属性图索引功能
LlamaIndex 团队发布了新的属性图索引Property Graph Index,为知识图谱构建提供了更灵活和强大的方法。该功能使用属性图表示法,克服了传统知识三元组的局限,支持节点和关系的标签和属性分配,并能同时执行向量和符号检索。开发者可以通过多种图构建方法(如基于模式的提取、隐式提取和自由形式提取)灵活控制知识图谱结构。
此外,属性图索引支持关键词/同义词检索、向量相似性检索、Cypher 查询语言和自定义图遍历,实现高级混合搜索。LlamaIndex 还提供 PropertyGraphStore 用于直接操作图数据,包括插入、更新和查询节点、关系及属性。
?https://www.llamaindex.ai/blog/introducing-the-property-graph-index-a-powerful-new-way-to-build-knowledge-graphs-with-llms?utm_source=uwl.me
2.Dot AI 伴侣应用程序
Dot 是由 New Computer 公司开发的一款 AI 伴侣应用程序。该应用程序由 Jason Yuan(前苹果设计师)和 Sam Whitmore(工程师)共同创立,并获得了来自 Lachy Groom、OpenAI Fund 和 South Park Commons 等的 370 万美元融资。
Dot 是一款专为 iPhone 用户设计的个性化 AI 应用程序,它能够随着用户的互动而学习和演进,拥有无限的长期记忆,能够提供个性化的建议和指导,帮助用户成为更好的自己。
?https://apps.apple.com/us/app/dot-living-history/id6450016041
3.Otto:为 AI 工作设计的工具
Otto 是一个专为 AI 工作设计的工具,通过定义一次表格来自动化成千上万的任务,提升研究和分析公司、市场和行业的效率。用户只需点击 “获取访问权限” 即可开始使用 Otto,其多种模板(如公司研究、竞争对手格局分析和外向邮件创建器)展示了 Otto 的强大功能。Otto 利用智能推理引擎,几分钟内完成通常需要几小时的工作,提供表格驱动的界面,支持可定制列、高级过滤和精确定制输出,并行运行数百个任务,让用户专注于更大的画面。
?https://ottogrid.ai/
4.Playmaker Document AI:简化文档工作流程
Playmaker Document AI 是一款自动化工具,专为简化文档工作流程设计。它支持多种文档类型,如合同、发票和身份证明等,能够通过电子邮件、API 或手动上传方式提交文档,从而自动提取、验证和处理数据。提取的数据可推送到 300 多个集成系统,实现高效的自动化流程。
此外,Playmaker Document AI 确保数据安全性,处理完成的文档会在 7 天内安全删除。系统具有持续学习能力,不断提高处理精度,并提供全球团队支持,让用户轻松提高工作效率。
?https://www.playmaker.so/document-ai
5.Diffutoon:将光照 tracing 视频转换为动漫风格
Diffutoon 项目旨在将现有的光照 tracing 视频转换为具有动漫风格的影片,适应极高的分辨率和快速动态场景。项目源代码已在 DiffSynth-Studio 平台上开源,并附有技术报告。
?https://ecnu-cilab.github.io/DiffutoonProjectPage/
6.groqnotes:智能音频转录与笔记生成工具
groqnotes 是一个基于 Streamlit 的应用程序,利用 Groq 云端的 Whisper-large 和 Llama3 模型,将音频转录为结构化笔记。支持 Markdown 格式和 PDF 下载。功能亮点包括:
音频转录:上传音频文件,快速转录成包含表格、代码和 Markdown 格式的笔记。
示例展示:提供如何使用工具生成 YouTube 视频内容笔记的示例。
下载选项:生成的笔记可下载为文本或 PDF 文件,方便保存和分享。
?https://github.com/Bklieger/groqnotes
7.Nucleus 宣布 Anifusion 新功能:
Nucleus 在 X 平台上宣布,即将在 ANIFUSION DOT AI 上推出漫画画板创建功能,简化用户操作。新功能包括自动图像定位和即将添加的文本工具,用户无需手动剪辑图像即可轻松创建漫画画板。
?https://anifusion.ai/
大牛洞见
AI Storyteller 课程:掌握人工智能和大型语言模型的知识
Andrej Karpathy 推出了一个名为 LLM 101 的新课程,专注于大型语言模型的基础知识和实践应用。通过构建一个 AI Storyteller,学习者将全面理解并掌握人工智能和大型语言模型的知识。课程从基础到高级,涵盖编程语言、数据类型、张量操作、深度学习框架和神经网络架构。多模态学习部分更是深入探讨如何处理和生成图像、音频和视频数据,提供从初学者到高级用户的全面学习路径。
? https://github.com/karpathy/LLM101n
敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。