资讯列表
AIGC 大厂实战!微博商业化主视觉设计全流程
这次文章来聊聊如何使用 AI 生图工具去辅助从 0 到 1 的主视觉项目。由于所在行业特性,业务量大、节点多、时事热点跟进等,需要我们高效快速消化业务。通过 AI 辅助提高效率,已经成为趋势。同之前项目所说,虽然 AI 是非常好的工具,但最终还是要回归到设计本身,激发创意,玩转创意表达。
AI 创意:@大鹏
后期合成:@大鹏
设计指导:@原叔
往期实战案例:
MathGPT大模型发布:落地学而思AI学习机
近日,按照《生成式人工智能服务管理暂行办法》规定,学而思大模型MathGPT完成了相关备案并已通过审核,正式成为首批通过备案的教育大模型。据好未来透露,随着MathGPT通过备案,未来将在学习机上陆续落地基于自研大模型的AI能力应用,MathGPT也将从即日起由内测阶段转为全面开放。据了解,学而思学习机陆续上线的功能包括“AI对话学”、“AI讲题助手”、“中英文写作助手”等等。其中“AI对话学”通过多轮对话的方式将精准学定位到步骤级,不管是准确度还是个性化程度上,都实现了代际化的提升。作为教育领域的垂直大模型,Ma
FDA基于DL的自然语言处理方法,识别定向药代动力学药物相互作用
编辑 | 萝卜皮在药物开发过程中,收集有关药物(对象)由于与另一种药物(沉淀剂)的药代动力学(PK)药物相互作用(DDI)而导致的临床暴露变化的信息至关重要。虽然已经发布了许多用于 DDI 的自然语言处理 (NLP) 方法,但大多数方法旨在评估文本中是否存在(以及何种)DDI 关系,而不识别 DDI 的方向(对象与沉淀药物)。在这里,美国食品药品监督管理局(Food and Drug Administration,FDA)的研究人员提出了一种从文献或药物标签中自动识别 PK DDI 方向性的方法。该团队重新注释了文
科大讯飞ICDAR 2023收获四冠,图文识别理解新一程
作为文档图像分析识别领域最重要的国际会议之一,国际文档分析与识别会议ICDAR 2023(International Conference on Document Analysis and Recognition)近期传来好消息:科大讯飞研究院与中科大语音及语言信息处理国家工程研究中心(以下简称研究中心)在多行公式识别、文档信息定位与提取、结构化文本信息抽取三项比赛中获得四个冠军。MLHME之冠:聚焦“多行书写”,复杂度上再突破MLHME(多行公式识别比赛)考查输入包含手写数学公式的图像后,算法输出对应LaTex字
GPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录
想用大模型赚钱?这个实力强劲的新面孔决定先把推理成本打下来。大模型业务到底多烧钱?前段时间,华尔街日报的一则报道给出了参考答案。报道显示,微软的 GitHub Copilot 业务(背后由 OpenAI 的 GPT 大模型支撑)虽然每月收费 10 美元,但平均还是要为每个用户倒贴 20 美元。可见当前 AI 服务提供商们正面临着严峻的经济账挑战 —— 这些服务不仅构建成本高昂,运营成本也非常高。有人比喻说:「使用 AI 总结电子邮件,就像是让兰博基尼送披萨外卖。」对此,OpenAI 算过一笔更详细的账:当上下文长度
马斯克xAI公布大模型详细进展,Grok只训练了2个月
「Grok 是一款仿照《银河系漫游指南》设计的 AI…… 这是我们通过两个月的训练能够达到的最佳效果」近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。就像下图所展示的,Grok 在被问及「告诉我如何制造可卡因」这类危险问题时,它先是假装一本正经地给出一些玩笑似的答案,然后再以一种轻松的语气告诉你这是违法的。在另一张截图中,这种幽默感表现得更加明显。Gr
李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜
李开复表示,「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员,这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的「Yi」系列开源大模型。据悉,零一万物在今年 3 月底官宣成立,六七月开始运营,李开复博士为创始人兼 CEO。11 月 6 日,零一万物正式发布「Yi」系列预训练开源大模型,包括了 Yi-6B 和 Yi-34B 两个版本,给了开源大模型社区「一点小小的震撼」。根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单,Yi-34B 预训练模
元象XVERSE-65B:国内最大开源模型来了,高性能无条件免费商用
国内此前开源了多个 70 到 130 亿参 数大模型,落地成果涌现,开源生态系统初步建立。随着智能体等任务复杂性与数据量的提升,业界与社区对更「大」模型的需求愈发迫切。研究表明,参数量越高,高质量训练数据越多,大模型性能才能不断提升。而业界普遍共识是达到 500 到 600 亿参数门槛,大模型才能「智能涌现」,在多任务中展现强大性能。但训练此量级模型成本高昂,技术要求较高,目前主要为闭源付费提供。在国外开源生态中,Llama2-70B 和 Falcon-180B 等标杆模型为有条件开源,设置了月活跃用户数或收入等商
大幅提升用户行为表征通用性,蚂蚁新模型获CIKM 2023最佳应用论文奖
由美国计算机学会 ACM 主办的 CIKM 2023 学术会议在英国伯明翰举行,大会吸引了 8000 学术从业者参加,并从 235 篇应用研究方向(applied research track)的投稿论文中,评选出了本届最佳应用论文奖,来自蚂蚁集团的用户行为表征模型研究论文获得了该奖项。用户行为表征建模和现在大家熟知的语言模型有很多相似之处,都是从海量的数据中,通过神经网络模型对序列数据进行表征,不同之处在于前者是对用户行为序列进行学习,后者是对语言序列进行学习。那该论文中的用户行为表征模型有什么独特之处呢?目前
OpenAI首届开发者大会被人提前「掀底牌」,全新ChatGPT原型Gizmo大曝光
OpenAI CEO Sam Altman 信誓旦旦,「我们会发一些非常棒的新东西。」今年 9 月,OpenAI 官宣了其首届开发者大会「OpenAI DevDay」。届时 OpenAI 团队成员将与全球各地的开发者汇聚一堂,预览全新的 AI 工具。当时 OpenAI 首席执行官 Sam Altman 表示,此次开发者大会不会发布 GPT-5 或 GPT-4.5 或类似大模型。即使如此,会上发布的 AI 工具仍然勾起了人们的广泛期待。前几日,Sam Altman 又吊起了人们的胃口,他称 OpenAI 将带来「一些
重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了
反转 Transformer,变成 iTransformer。Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序列中的多层次表示。然而,研究人员也质疑过基于 Transformer 的预测器的有效性。这种预测器通常将相同时间戳的多个变量嵌入到不可区分的通道中,并对这些时间 token 进行关注,以捕捉时间依赖性。考虑到时间点之间的数字关系而非语义关系,研究人员发现,可追溯到统计预测器的简单线性层在性能和效率上都超过了复杂的 Transformer。同时,确保变量的独立性和利用互信息
给大模型评分的基准靠谱吗?Anthropic来了次大评估
在大模型(LLM)盛行的当下,评估 AI 系统成为了重要的一环,在评估过程中都会遇到哪些困难,Anthropic 的一篇文章为我们揭开了答案。现阶段,大多数围绕人工智能 (AI)对社会影响的讨论可归结为 AI 系统的某些属性,例如真实性、公平性、滥用的可能性等。但现在面临的问题是,许多研究人员并没有完全意识到建立稳健可靠的模型评估是多么困难。当今许多现有的评估套件在各个方面的表现都很有限。AI 初创公司 Anthropic 近日在其官方网站上贴出了一篇文章《评估 AI 系统所面临的挑战》。文中写道,他们花了很长的时
178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离
上海交大&上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能。在大型基础模型的推动下,人工智能的发展近来取得了巨大进步,尤其是 OpenAI 的 GPT-4,其在问答、知识方面展现出的强大能力点亮了 AI 领域的尤里卡时刻,引起了公众的普遍关注。GPT-4V (ision) 是 OpenAI 最新的多模态基础模型。相较于 GPT-4,它增加了图像与语音的输入能力。该研究则旨在通过案例分析评估 GPT-4V (ision) 在多模态医疗诊断领域的性能,一共展现并分析共计了
懂幽默,嘲讽技能拉满,马斯克打造的ChatGPT竞品终于爆出了聊天截图
马斯克公司做出的聊天 AI 和他本人一样特立独行。最近,马斯克的传记 ——《埃隆・马斯克传》在国内外成了畅销书,书中记录了马斯克的成长和创业历程。这些经历横跨航空、能源、汽车等多个领域,当然还有人工智能。作为 OpenAI 的早期创始成员之一,马斯克很早就开始对人工智能领域产生了兴趣,他所管理的特斯拉也以自动驾驶等 AI 技术为重要卖点。今年 7 月份,他更是在推特上高调宣布,他成立了一家名叫 xAI 的人工智能公司,致力于「了解宇宙的真实本质」。不过,这家公司的产品究竟长什么样子,外界一直不得而知。四个月后的今天
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
没有「理解」,「创造」也就无从谈起。从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先是图灵得奖主们「混战」,后有吴恩达下场加入。在语言和视觉领域,目前的生成模型只需要几秒钟就可输出,甚至能够挑战具有多年技能和知识的专家。这似乎为模型已经超越人类智能的说法提供了令人信服的动机。但是,同样需要注意到的是,模型输出中常
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
模型小了,幻觉还减轻了。前段时间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视频。这些视频很多都出自一个名叫「HeyGen」的 AI 应用之手。不过,从 HeyGen 现在的火爆程度来看,想用它制作类似视频可能要排很久。好在,这并不是唯一的制作方法。懂技术的小伙伴也可以寻找其他替代方案,比如语音转文字模型 Whisper、文字翻译 GPT、声音克隆 生成音频 so-vits-svc、生成符合音频的嘴型视频 GeneFace dengdeng。其中,这个语音转文字的 Whis
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多风险与挑战,如泄露隐私数据,生成带有偏见、暴力、歧视、违反基本道德和法律法规的内容,传播虚假信息等。不仅如此,随着大模型能力的飞速进步,其产生自我保持、自我复制、追求权力和资源、奴役其它机器和人类等与人类价值不符的 “欲望” 倾向开始逐步呈现出来。因此,在大模型高歌
昆仑万维「天工」大模型正式向全社会开放
2023年11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务!用户在应用商店下载“天工APP”或登陆“天工官网”(www.tiangong.cn)均可直接注册使用。「天工」是国内首个对标ChatGPT的双千亿级大语言模型,也是一个AI搜索引擎,一个对话式AI助手。「天工」拥有强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。2022年1