千年甲骨文、一朝 AI 解:我国厦门大学团队探索新方法

厦门大学官方公众号昨日(12 月 4 日)发布博文,宣布该校团队正尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的甲骨文考释工作。

厦门大学官方公众号昨日(12 月 4 日)发布博文,宣布该校团队正尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的甲骨文考释工作。

甲骨文简介

AI在线援引博文介绍,甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文字之一,是现代汉字的根脉。

千年甲骨文、一朝 AI 解:我国厦门大学团队探索新方法

传统的甲骨文字考释工作极其耗时费力,依托于专家进行人工释读,多采用字形分析、辞例研究等方法,需要考古专家以深厚的知识积累和大量的文献阅读为基础,结合多方面的知识去破译甲骨字,已经难以为继。

借助 AI 破译甲骨文

近年来 AI 技术迅猛发展,利用深度学习模型超强语义表示能力来实现甲骨文的辅助考释,优势已经崭露头角。

团队研究人员针对甲骨文数据稀缺、图像质量参差不齐的现状,系统整理相关古文字数据,构建更大规模、更高质量的甲骨文多模态数据集,提出了“基于甲骨文多模态大模型的多元信息辅助考释模型”的技术方案。

项目将设计一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体 IDS(表达结构的部首偏旁序列)解码和甲骨字现代字对译关系等,以有效训练多模态大模型。

千年甲骨文、一朝 AI 解:我国厦门大学团队探索新方法

团队利用其强大的跨模态理解能力,辅助甲骨文考释。在大模型提供的语义嵌入基础上,本项目还将设计融合音、形、义、用多元信息的端到端甲骨文综合考释模型,综合利用字形结构、语义关联、同音通假和用法聚类分析,开发一种更加轻量的考释系统,以适应资源有限的实际考释场景。

给TA打赏
共{{data.count}}人
人已打赏
应用

消息称马斯克的 xAI 已订购 10.8 亿美元的英伟达 GB200 AI 服务器,并获得优先交付权

2024-12-5 9:11:49

应用

斯坦福学者承认其法庭文件因使用 ChatGPT 出错,但称不影响文件实质内容

2024-12-5 9:36:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索