知识

超三万种材料,近百万真实材料合成表征信息,LLM精准构建材料知识图谱MKG,登NeurIPS 2024

编辑 | ScienceAI知识图谱集成多源数据信息为结构化知识,以阐明复杂科学领域的数据结构并介导研究进展、创新和应用的结构化知识交流。 为了统筹和分析分散在数以百万计的文献中的材料学知识,新南威尔士大学(UNSW)、同济大学、香港城市大学以及 GreenDynamics 律动造物,构建了材料知识图谱(MKG)。 该团队依托于大型语言模型独立设计的本体论,并自动化地提取及清洗了大量的材料学文献中的知识,构建出了丰富的知识图谱。

三星收购英国 Oxford Semantic Technologies 公司:让本地 AI 模拟人类方式处理复杂任务

三星公司今天(7 月 18 日)发布新闻稿,宣布收购英国知识图谱初创公司 Oxford Semantic Technologies,进一步增强本地 AI 功能,为用户提供更个性化的 AI 体验。AI在线查询公开资料,Oxford Semantic Technologies 公司成立于 2017 年,由伊恩・霍罗克斯(Ian Horrocks)、鲍里斯・莫蒂克(Boris Motik)和贝尔纳多・昆卡・格劳(Bernardo Cuenca Grau)三位牛津大学教授创办。该公司目前主打产品是 AI 引擎 RDFox,

全国高校首个,山东财经大学发布新文科教育教学专有大模型“AI 才”

AI在线从山东财经大学获悉,7 月 11 日,该校发布了全国高校首个新文科教育教学专有大模型 ——“AI 才”教育教学专有大模型,该模型由学校与百度智能云、山东银瑞科技合作共同开发。据介绍,该大模型可通过大数据、机器学习、知识图谱等关键技术,搭建智能科教环境,打造具有专业性、个性化、系统性、一站式特点,集“知”“教”“学”“研”“训”“智”为一体的教学科研服务平台。该大模型具备如下功能及特性:“知识数字化”板块:可在大模型平台上进行专业教材、科研数据、实习实训案例等知识的规范化、结构化梳理和沉淀,形成自有知识库,实

港大马毅:现在的大模型只有「知识」,没有「智能」

导语:知识与智能是两个概念。 访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law(规模定律)作为信仰并投身其中时,马毅却选择了一条少有人走的路。 「模型无所谓大小,我们说正确的模型,主要看机制是否正确,这才是智能的本质。

院士领衔推出大模型的第 3 种记忆:比参数存储和 RAG 都便宜,2.4B 模型越级打 13B

给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!中科院院士鄂维南领衔,上海算法创新研究院等团队推出 Memory3,比在参数中存储知识以及 RAG 成本都更低,同时保持比 RAG 更高的解码速度。在实验中,仅有 2.4B 参数的 Memory3 模型不仅打败了许多 7B-13B 的模型,在专业领域任务如医学上的表现也超过了传统的 RAG 方法,同时推理速度更快,“幻觉”问题也更少。目前相关论文已上传到 arXiv,并引起学术界关注。知识按使用频率分类这一方法受人脑记忆原理启发,独立于存储在模型参数

论坛预告| “知识改变世界——垂直大模型重新定义知识管理”论坛即将开幕

前言大模型技术在加速知识获取、整合、应用及创新方面拥有巨大潜力,能够为教育、金融、政务等多个行业带来变革性影响。然而,目前我国垂直大模型在企业场景中的应用尚处于探索阶段,许多企业仍在寻求大模型的最佳落地方案,其中,与企业内部知识库深度融合被视为是垂直大模型落地企业级场景应用的重要方向。为此,在2024世界人工智能大会暨人工智能全球治理高级别会议期间,达观数据将携手复旦-达观金融垂直应用大模型校企联合研究中心、浦东青联联合主办“知识改变世界——垂直大模型重新定义知识管理”主题论坛。论坛将于2024年7月6日上午9点至

蚂蚁集团、浙江大学联合发布开源大模型知识抽取框架OneKE

近日,由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架OneKE宣布开源,并且捐赠给OpenKG开放知识图谱社区。知识图谱是实现大模型可信可控的关键技术之一,知识抽取可助力构建领域知识图谱。OneKE致力于帮助研究人员和开发者更好地处理信息抽取、文本数据结构化、知识图谱构建等问题。比如,通过OneKE抽取风险事件、人物实体、机构实体等可以清晰呈现事件脉络、事件发展趋势和实体之间关联,构建好的图谱可以帮助大模型实现跨实体、跨文档的复杂推理 。OneKE支持中英双语,支持OpenSPG及DeepKE开源框架,可开箱即用

印象笔记发布自研大模型,全新的生产力工具要来了?

(2024年4月12日 北京)今日,印象笔记宣布其自研大语言模型定名为「印象大模型」,并已根据《生成式人工智能服务管理暂行办法》及相关法律法规完成模型备案,为更多用户提供智能化知识管理服务。印象笔记作为生产力工具的领军厂商,始终坚持科技创新,为用户带来更好的知识管理体验。印象笔记专注于人工智能领域的研究机构——印象研究院成立于2018年,在自然语言处理、神经网络算法等领域持续深耕,自2018年起陆续推出智能推荐、智能标签、智能摘要、知识星图等一系列人工智能驱动的核心产品功能。2023年3月,印象研究院基于在AIGC

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

编辑 | ScienceAI深度学习模型因其能够从大量数据中学习潜在关系的能力而「彻底改变了科学研究领域」。然而,纯粹依赖数据驱动的模型逐渐暴露出其局限性,如过度依赖数据、泛化能力受限以及与物理现实的一致性问题。例如,美国OpenAI公司开发的文本到视频模型Sora因深刻理解事物在现实中的存在方式而受赞誉,被视为AI领域的飞跃。尽管能利用大量视觉数据生成逼真图像和视频,Sora却被认为未掌握物理定律,如重力和玻璃破碎等。面对这一问题,将人类知识融入深度学习模型是一个潜在的解决方案。将先验知识与数据一起使用,能够提升

百度Comate开放插件生态,智能代码助手定制化时代来临

3月1日,百度旗下智能代码助手Baidu Comate 又添两大重磅能力:“Comate ” 开放平台、AutoWork “私人研发助理”,为行业首家免费开放试用。本次发布,Baidu Comate 将更加贴合软件研发现场,通过易用的研发平台、丰富的插件基础能力、自主定制能力以及企业接入私域知识与自有能力等,更好满足企业定制化开发需求,助力企业低成本打造适合自己企业的智能代码助手,大幅提升软件研发体验和效率。“Comate  ” 开放平台实现了将企业私域知识、第三方能力与编程现场深度结合,直接触达研发人员第一工作

夸克大模型助力学术科研提效,四大优势提升知识正确性

当严谨的学术科研与创新的大模型技术结合在一起,会擦出什么样的火花?日前,夸克大模型甫一推出便以优秀的性能成为国产大模型中的“学霸”。在中国科学技术协会近期主办的“大模型应用场景研讨会”上,夸克大模型在快速阅读、创作润色等四大场景中展现出的效率提升潜力,引发了科技工作者们的热议和期待。当前,大模型技术处在高速发展阶段,在学术领域推进大模型到应用层面,首先要解决知识正确性问题成为业界共识。凭借在搜索业务和智能技术上的长期积累,近期发布的夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。在医疗等垂直领域,

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

编辑 | 萝卜皮几个世纪以来,研究人员一直在寻找连接不同领域知识的方法。随着人工智能的出现,我们现在可以探索跨领域(例如,力学-生物学)或不同领域(例如,失效力学-艺术)的关系。为了实现这一目标,麻省理工学院(MIT)原子与分子力学实验室 (Laboratory for Atomistic and Molecular Mechanics,LAMM)的研究人员使用了经过微调的大型语言模型 (LLM),来获取多尺度材料失效的知识子集。该方法包括使用通用 LLM 从原始来源中提取问答对,然后进行 LLM 微调。由此产生的

用于化学研究的 GPT-4:什么可以做,什么不可以做?

编辑 | 紫罗GPT-4 在应对化学挑战方面表现出非凡的能力,但仍然存在明显的弱点。东京工业大学的化学家 Kan Hatakeyama-Sato 表示:「它对化学有着显著的理解,这表明它可以以类似于人类思维过程的方式预测和提出实验结果。」最近,Hatakeyama-Sato 和他的同事在《Science and Technology of Advanced Materials: Methods》杂志上发表题为《用于化学研究的 GPT-4 指示工程:什么可以/不可以做?》(「Prompt engineering of

国内百模大战正盛,海致科技推出首个知识图谱融合大模型应用平台

从 ChatGPT 引发的大众追捧到 “百模大战”,大语言模型和生成式 AI 正在以前所未有的速度改变人类的生活和生产方式。全球用户很快发现,在与大语言模型交互的过程中,会碰到它 “一本正经的胡说八道”,输出似是而非甚至荒谬的结果,这也在不断引发 C 端用户 “调侃” 大模型的 “狂欢”。然而,这种被称作 “大模型幻觉” 的技术特点却阻碍了它在 B 端和工业界的应用与发展。

大型语言模型与知识图谱协同研究综述:两大技术优势互补

多图综述理清当前研究现状,这篇 29 页的论文值得一读。

体验过百度文心一言,也许真会超出你的预期

百度文心一言效果到底怎样呢?我们亲自试了试,结果发现……

ChatGPT一路狂飙,我们的安全带在哪儿?

自去年 11 月 30 日发布以来,OpenAI 的 ChatGPT 已经在短短的三个月内席卷了各个社会领域:普通人用它当搜索引擎;办公室文员用它来写文案、做会议纪要,程序员用它来写代码。

知识图谱构建下的自动问答KBQA系统实战

目前工程落地实现问答的技术路线基本分为基于知识图谱的问答(KBQA)、基于阅读理解的问答(MRC)和常见问题问答(FAQ)三种模式