AI在线 AI在线

应用

ChatGPT越来越懒,都学会反过来PUA人类了

OpenAI 表示自 11 月 11 日以来,他们就没有更新过模型,模型行为是不可预测的,他们正在研究如何修复。不知你有没有注意到,最近一段时间,GPT-4 变得有些「懒惰」,现在的它,老是拒绝执行某些任务或直接返回简化的结果。 这个问题得到很多网友的共鸣,纷纷开始抱怨 ChatGPT 变「懒惰」这个事实。用户声称,最近使用 GPT-4 或 ChatGPT API 时,在高峰时段响应变得非常缓慢且敷衍。在某些情况下,它会拒绝回答,而在另一些情况下,如果出现一系列问题,对话就会中断。 据报道,如果用户请求 GPT-4
12/12/2023 3:04:00 PM
机器之心

数智蝶变进行时,产学大咖齐聚探索新型工业化「上海方案」

制造业是立国之本、强国之基,是实体经济的重要支撑。上海市推动制造业高质量发展,率先探索具有新时代特征的新型工业化道路。实施智能工厂领航计划、「工赋上海」行动计划,打造工业互联网平台,培育「工赋链主」企业…… 谋篇布局、统筹推进,上海全面推动制造业数字蝶变。为了进一步汇聚起推进新型工业化的强大合力,推动数字蝶变行动落地见效,在即将举办的数智上海 2023 峰会・上海城市数字化转型体验周开幕式上,将特别举办「数智说」工业智能化论坛。12 月 16 日下午,上海杨浦五角场凯悦酒店,论坛将汇聚上海交通大学知名专家学者,中国
12/12/2023 2:58:00 PM
机器之心

2024年AI趋势看这张图,LeCun:开源大模型要超越闭源

能感受到其中的趋势吗?2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时,另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀?是否能够媲美专有模型的性能?迄今为止,我们一直还只能说是某些方面接近。即便如此,开源模型总会给我们带来经验的表现,让我们刮目相看。开源模型的兴起正在改变游戏规则。如 Meta 的 LLaMA 系列以其快速迭代、可定制性和隐私性正受到追捧。这些模型被社区迅速发展,给专有模型带来了强有力的挑战,能够改变
12/12/2023 2:50:00 PM
机器之心

Protein BLAST会成为过去吗?AlphaFold等对蛋白结构的搜索是否会取代对序列的搜索

编辑 | 白菜叶像 AlphaFold 这样的蛋白质结构搜索工具会用 BLAST 取代蛋白质序列搜索吗?德累斯顿工业大学的研究团队讨论了使用结构搜索进行远程同源性检测的前景,以及为什么蛋白质 BLAST 作为领先的序列搜索工具应努力纳入结构信息。BLAST 广泛用于分子生物学中搜索核苷酸和蛋白质序列。BLAST 推出三十年后,结构预测出现了重大突破,出现了 RoseTTAFold 和 AlphaFold 等工具。因此,主要序列数据库中的每个蛋白质序列现在都带有一个 3D 折叠模型。虽然这不会影响(非编码)核苷酸序列
12/12/2023 11:52:00 AM
ScienceAI

人工智能顶会AAAI 2024放榜!联汇科技赵天成博士团队两篇论文入选

近日,第38届国际顶级人工智能学术会议AAAI(Association for the Advancement of Artificial Intelligence)正式发布了2024年会议的录用通知,联汇科技赵天成博士团队两篇论文入选。AAAI 是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的 A 类国际学术会议。据了解,本届AAAI会议共有12100篇投稿(主赛道),打破历史纪录,经过全面而严格的审查程序,共有2342篇论文
12/12/2023 10:52:00 AM
新闻助手

为通用人工智能提速,蚂蚁图计算连续四次打破权威测评世界纪录

近日,国际关联数据基准委员会(Linked Data Benchmark Council,以下简称LDBC)发布了图数据基准测评“LDBC SNB-BI”最新结果。由蚂蚁集团自研的流式图计算引擎TuGraph Analytics在30TB规模的数据集上成功完成了基准测试,数据规模和性能打破了此前美国某图数据库厂商的公开纪录,关键指标中的并发吞吐量提升至2.84倍,查询能力提升至1.86倍。 LDBC官方公布蚂蚁LDBC SNB-BI测评新纪录在本次测评中,测试产品需要快速导入和分析30TB 规模的数据,处理多达72
12/12/2023 10:47:00 AM
新闻助手

MIT顶尖机器人学家创业,融资数千万,受线虫启发开发液态网络,叫板OpenAI

机器之能报道编辑:吴昕MIT 计算机科学和人工智能实验室 CSAIL 孵化的创业公司—— Liquid AI 终于结束隐身模式,公开与 OpenAI 和其他公司的大型语言模型竞争。近日,Liquid AI 官宣已筹集 3750 万美元。就种子轮而言,这个数字相当可观。投资人不乏一些大人物,比如 GitHub 联合创始人 Tom Preston Werner、Shopify 联合创始人 Tobias Lütke 和 Red Hat 联合创始人 Bob Young。融资后,公司估值 3.03 亿美元。著名机器人学家和计
12/12/2023 10:21:00 AM
机器之能

第一波!2023年12月精选实用设计工具合集

大家好,这是 2023 年 12 月的第 1 波干货合集!这次的合集依然是以 AI 工具为主,有意思的是,如今的的 AI 工具越来越细化,越来越专业化,今天推荐的 AI 产品设计工具 Vizcom、AI LOGO 生成工具 LOGO Diffusion,都是这样的工具。此外,今天的列表中,还有第三方 GPT 商店,Blender 资源下载插件,以及高清图片下载工具。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、基于 AI 的产品可视化生成工具 Vizcom 的产品设计
12/12/2023 8:05:43 AM
陈子木

全面超越GPT-4?一文详解Google新模型Gemini

大家好我是花生~ 最近 Google 发布了一个新的多模态大模型 Gemini,在 AI 模型领域掀起了一轮新的讨论热潮,风头一时间甚至盖过了 GPT-4。那么 Gemini 的具体功能有哪些,相比其他大模型又有何特点呢?今天我们就一起来看看。 了解 GPT-4:一、 Gemini 的功能 Google 称 Gemini 是其历史上最强大、最通用的模型,在许多基准测试中都具有最先进的性能。Google DeepMind 的 CEO Demis Hassabis 称 Gemini 可以像人类一样理解我们周围的世界,并
12/12/2023 7:00:22 AM
夏花生

助力AI技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”

当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机器学习领域的顶级会议,与 ICML 并称为人工智能领域难度最大,水平最高,影响力最强的会议。会议首日,中国互联网企业蚂蚁集团受邀举办主题为“知识增强 AI 在垂直行业的应用探索”(Knowledge-enhanced AI for Industry Verticals)的研讨会,并在会上开源了
12/11/2023 4:25:00 PM
新闻助手

夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文

本届 EMNLP 大会在投稿人数上创了新高,整体接收率也较上届略有提升。EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 ACL 2023。在接收率方面,长论文接收率为 23.3%,短论文接收率为 14%,整体接收率为 21.3%。这一数据相较 EMNLP 2022 的 20% 略有提升。我们从这次 EMNLP 的 loc
12/11/2023 4:08:00 PM
机器之心

生成式 AI 如何赋能千行百业?产学大咖剖析金融、工业、医疗和教育等关键领域前沿实践

在近日对上海市的考察调研中,习近平总书记参观了上海科技创新成果展,指出推进中国式现代化离不开科技、教育、人才的战略支撑,上海在这方面要当好龙头,加快向具有全球影响力的科技创新中心迈进。创新力就是竞争力,上海正勇担使命、奋力攻坚。为了更好地提升上海科技创新策源能力,进一步推进上海国际科技创新中心建设,将于12 月 16 日举办数智上海 2023 峰会·上海城市数字化转型体验周开幕式。作为引领新一轮科技浪潮的关键技术,生成式AI 正在各行业、各领域催生创新应用,带来全新的机遇与挑战。为了更好地推动「上海市 AI 大模型
12/11/2023 4:03:00 PM
机器之心

零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单

在盲测对比中也取得了好成绩。最近,业内众多大模型基准又迎来了一轮 “实力值” 更新。继 11 月初零一万物发布 Yi-34B 基座模型后,Yi-34B-Chat 微调模型在 11 月 24 日开源上线 ,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。其中,在斯坦福大学提出的大语言模型评测基准 AlpacaEval 上,Yi-34B-Chat 以 94.08% 的胜率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 经认证的模型类别中,成为业内仅次
12/11/2023 3:58:00 PM
机器之心

像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略

随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务以外的一般任务的性能明显下降,损害 LLM 原本具备的通用能力。另一方面,开源社区的模型逐渐增多,大模型开发者也可能在多次训练中累计了越来越多的模型,每个模型都具有各自的优势,如何选择合适的模型执行任务或进一步微调反而成为一个问题。近日,智源研究院信息检索与知识计算组
12/11/2023 3:47:00 PM
机器之心

一条磁力链接席卷AI圈,87GB种子直接开源8x7B MoE模型

「高端」的开源,往往采用最朴素的发布方式。昨天,Mistral AI 在 X 平台甩出一条磁力链接,宣布了新的开源动作。没有长篇官方博客,没有刻意加速的 Demo,这家公司算是当下大模型领域的「一股清流」。打开一看,发现是接近 87 GB 的种子:参数配置什么样?很多人放弃了周末,第一时间下载运行起来。看上去,Mistral 8x7B 使用了与 GPT-4 非常相似的架构,但是「缩小版」: 8 个专家总数,而不是 16 名(减少一半) 每个专家为 7B 参数,而不是 166B(减少 24 倍)42B 总参数(估计)
12/11/2023 3:44:00 PM
机器之心

开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。近日,亚马逊上海人工智能研究院推出细粒度大模型幻觉检测工具 BSChecker,包含如下重要特性:细粒度幻觉检测框架,对大模型输出文本进行三元组粒度的幻觉检测。幻觉检测基准测试集,包含三种任务场景,满足
12/11/2023 3:32:00 PM
机器之心

人均6万美元:2024英伟达奖学金名单公布,五位华人入选

「他们是全球最有才华的博士生。」本周五,备受期待的英伟达奖学金公布了入选者名单。二十多年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近 200 名学生提供了 600 万美元的资助,推动了机器学习、计算机视觉、机器人和系统编程等领域的研究工作。今年的奖学金计划向参与计算创新所有领域研究的 10 名博士生提供每人高达 6 万美元的奖学金。英伟达奖学金面向全球学者,每年都会出现激烈的竞争,今年的候选人就
12/11/2023 3:20:00 PM
机器之心

华为诺亚&清华:基于认知的万物超分大模型CoSeR

从低清图像中提取认知特征,这样的超分辨率才更真实。图像超分辨率技术旨在将低分辨率图像转换为高分辨率图像,从而提高图像的清晰度和细节真实性。随着超分技术的发展和手机硬件性能的提升,人们期望拍摄出更加清晰的照片。这项技术在手机影像等领域有着广泛的应用和需求。然而,现有的超分方法存在一些局限性,如下图所示,主要有以下两个方面:一是缺乏泛化能力。为了实现更好的超分效果,通常需要针对特定场景使用特定传感器采集到的数据来进行模型训练,这种学习方式拟合了某种低清图像和高清图像间的映射,但在其他场景下表现不佳。此外,逐场景训练的方
12/11/2023 3:11:00 PM
机器之心