自然语言

ELMo模型可用于训练动态词向量，该模型有哪些优缺点？与BERT模型之间的区别是什么？｜深度学习｜大模型
ELMo（Embeddings from Language Models）是一种基于深度学习的动态词向量模型，它通过双向LSTM（长短期记忆网络）来生成词的表示，相较于传统的静态词向量方法，如Word2Vec和GloVe，ELMo能够根据上下文生成不同的词向量。这使得ELMo能够更好地处理同义词、歧义词以及多义词的上下文依赖关系，从而提升自然语言处理（NLP）任务的表现。然而，ELMo也存在一…
理论
- 970
- 0
亦然19小时前
2024 ACL Fellow名单出炉！微软高剑峰等4位华人科学家入选
2024 ACL Fellow的名单正式出炉了！今年，国际计算语言学协会（ACL）评选了9位来自全球的科学家，其中华人学者占了4席。他们分别是：微软高剑峰、哈尔滨工业大学（深圳）张民、Meta FAIR实验室Scott Wen-tau Yih、滑铁卢大学Jimmy Lin。
理论
- 975
- 0
新智元12月12日
自然语言处理（NLP）：开启人机交互新篇章
在数字化时代，我们与智能设备的交互日益频繁，从设置闹钟到获取产品推荐，这些便捷的操作背后，离不开一项关键技术——自然语言处理（Natural Language Processing, NLP）。 NLP作为计算机科学的一个重要分支，正逐步改变着我们与机器的交流方式，使计算机能够更智能地理解和响应人类语言。本文将深入探讨NLP的基本概念、关键技术、应用场景以及未来发展，带领读者走进这一充满无限可能…
理论
- 974
- 0
AGI12月6日
终于把神经网络中的知识蒸馏搞懂了！！！
大家好，我是小寒今天给大家分享神经网络中的一个关键知识点，知识蒸馏知识蒸馏是一种模型压缩方法，用于将大型神经网络（教师模型）中的知识转移到较小的神经网络（学生模型）中。这一技术能够在保持或接近原始模型性能的情况下，显著减小模型的体积，从而提升推理效率。知识蒸馏在很多场景中非常有用，尤其是在计算资源有限或需要部署到边缘设备的应用中。
理论
- 975
- 0
程序员小寒12月2日
LLM-R：基于RAG和层次化Agent落地案例解析
在这个由智能设备主导的时代，维护工作的重要性愈发凸显，几乎成了生产活动的守护神。想象一下，当一台精密的机器在深夜突发故障，而维护手册却像天书一样难以理解，这时，交互式电子技术手册（IETMs）就像一束温暖的灯塔，指引着维护人员安全渡过难关。面对从图形用户界面（GUIs）到自然语言用户界面（LUIs）的转变，以及复杂逻辑关系的梳理，传统的IETMs显得有些力不从心。
理论
- 970
- 0
哎呀AIYA11月14日
整合海量公共数据，谷歌开源 AI 统计学专家 DataGemma
准确的统计数据、时效性强的信息，一直是大语言模型产生幻觉的重灾区。知识是现成的，但学是不可能学的。并非此身惰怠，只因现实太多阻碍。对于这个问题，谷歌在近日推出了自己筹划已久的大型数据库 Data Commons，以及在此基础上诞生的大模型 DataGemma。论文地址： Commons 是一个庞大的开源公共统计数据存储库，包含来自联合国（UN）、疾病控制与预防中心（CDC）、人口普查局、卫生部、环…
应用
- 8
- 0
汪淼10月2日
新型人形机器人 Menteebot 亮相：人类可用自然语言向其发号施令
草创公司 Mentee Robotics 今日展示了旗下首款人形机器人的原型，号称在所有操作层都继承了人工智能，也是“你可以指导的”个性化人工智能机器人。 IT之家汇总该产品大致信息：它可以奔走、侧身行走甚至转弯，官方称其具有与人类相同的平衡和控制力。据介绍，它在举起重物时还会调整步态。功能层面，该机器人内置人工智能算法、自然语言解决模型和软件，可以启动“高级训练技术”。该公司表示，这意味着机器人…
AI
- 7
- 0
清源4月17日
哥伦比亚大学计算机系副教授俞舟老师聘请博士后
本期将为大家介绍哥伦比亚大学计算机系副教授俞舟老师聘请博士后的相关信息。
AI
- 10
- 0
机器之心23年4月29日