应用
元象首个多模态大模型XVERSE-V开源,刷新权威大模型榜单,支持任意宽高比输入
人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向AGI(通用人工智能)迈出更大步伐。元象今日发布多模态大模型 XVERSE-V,支持任意宽高比图像输入,在主流评测中效果领先。 该模型全开源,无条件免费商用 ,持续推动海量中小企业、研究者和开发者的研发和应用创新。 XVERSE-V性能优异,在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向AGI(通用人工智能)迈出更大步伐。 元象今日发布多模态大模型 XVERSE-V ,支持任意宽高比图像输入,在主流评测中效果领先。 该模型全开源,无条件免费商用 ,持续推动海量中小企业、研究者和开发者的研发和应用创新。
“共筑安全星河:首届AI安全大赛在中关村论坛盛大启动”
在2024年的中关村论坛数据安全治理与发展论坛上,一项具有里程碑意义的活动——首届生成式人工智能安全大赛,正式拉开了帷幕。这场大赛是在北京市互联网信息办公室和中国科学院网络安全和信息化领导小组办公室的共同指导下,由中国科学院信息工程研究所与信息内容安全国家工程研究中心联合主办。此次大赛以“共筑安全星河,护航AI发展”作为核心主题,其宗旨在于依托中国科学院信息工程研究所Galaxy(星河)生成式人工智能安全风险测评平台,为参赛者提供一个专业的比赛环境。Galaxy平台,被誉为安全风险测评的“星河”,其核心是一个“以攻
当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律
你说箱子里要装满钻石,于是箱子被钻石填满,比实拍还要耀眼。这样的技能,哪个剧组不喜欢?这是前段时间 Adobe 旗下的视频剪辑软件 Premiere Pro 所呈现的「魔法」。该软件通过引入 Sora、Runway、Pika 等 AI 视频工具,实现在视频中添加物体、消除物体以及生成视频片段等能力,这被视为视频领域的再一次技术革新。从 2 月份 Sora 席卷全球到如今 Adobe 再施魔法,海外热火朝天。相比之下,国内在视频领域,尤其是长视频生成方向还处于「等待」状态。在过去的两个月里,我们已经听到了一些宣称追赶
苹果OpenAI合作,力争今年生成式AI登陆iPhone
ChatGPT,Gemini,Claude 三种大模型持证竞聘。OpenAI,Google,Anthropic 齐聚 Apple 下一代操作系统,WWDC24 上,iOS 的这块蛋糕究竟花落谁家?苹果在各国市场的 AI 领域,一直在业内寻求可靠并值得信赖的合作伙伴,以助于将各类生成式 AI 技术应用于 iPhone。例如:在中国市场,据 WSJ 报道:苹果近日宣布,为国行版 iPhone 16 系列、即将发布的 IOS18 操作系统、及 MAC 系统提供先进的 AI 功能,将与中国领先的 AI 公司百度达成战略合作
新 AI 系统可辅助外科医生完成内窥镜手术
总部位于日本东京的初创公司 Anaut 近日研发的 Eureka Alpha 系统开始投入实际使用,通过 AI 分析内窥镜图像,可以在外科手术过程中,实时协助外科医生,提高手术精确度,降低手术难度。Anaut 于 2023 年 6 月向日本厚生省申请批准,于今年 4 月 12 日获得批准,在手术中可以使用 Eureka Alpha 系统,目前该公司已经向日本 100 多家医院销售该系统。IT之家注:在内窥镜手术中,外科医生将内窥镜(一根末端带有摄像头和灯的管子)插入腹部的一个小开口。这种手术不需要大的切口,外科医生
新晋AI视频神器Haiper!零基础使用教程及应用案例
前言
2024 年绝对是 AI 视频爆发的一年!从年初 Sora 火爆全网,到现在各种 AI 视频工具和 AI 视频比赛纷纷上线。最近我在参加离谱村 AI 视频共创,主要用到 Pixverse、Runway、Haiper 三款工具,Haiper 算是我最近挖到的新宝贝,不仅可以文生视频、图生视频,而且可以视频转绘,重点是现在完全免费使用,接下来让我们一起来试一试吧!一、初步体验
目前,Haiper 可以在官网上或者 Discord 上使用,重点是免费无限次出视频。由于 Discord 上不能建立私人子频道,公共频道
如何AIGC应用于H5互动游戏?大厂全流程解析来了!
2023 年初,AIGC 发展如火如荼,新技术和应用层出不穷。作为一名长期从事游戏化营销设计、尤其是 H5 互动游戏开发的设计师,我敏锐地意识到 AIGC 带来的巨大机遇。为了紧跟这一波快速变革的浪潮,我开始深度使用各种 AI 工具,并积极探索如何将其与实际业务相结合,快速创造价值。
四月初,我萌生了将 AIGC 生成模式应用于 H5 互动游戏的想法。我向周围的伙伴们咨询是否有类似的研究,但大家都忙于工作,无暇顾及这些"业余"探索。作为一名对 AI 和 H5 游戏都有深刻理解的设计师,我决定主动出击,开启了这场"个
清华大学成立人工智能学院,图灵奖获得者姚期智任院长
清华大学今日宣布成立人工智能学院,聚焦“人工智能核心基础理论与架构”和“人工智能 X”两个重点方向,以高定位和新机制建设中国自主的“AI 顶尖人才和原始创新基座”,为实现高水平科技自立自强提供有力支撑。IT之家获悉,清华大学人工智能学院首任院长由图灵奖获得者、中国科学院院士姚期智担任。据介绍,清华大学在人工智能人才培养和科学研究方面有着深厚的积累,是国内最早开展人工智能教学和科研的单位之一,一批清华校友现已成为我国人工智能产业的中坚力量。新成立的清华大学人工智能学院将立足国家战略布局,进一步创新人才培养模式,吸
宜家宣布向人工智能化转型:开发专属 AI 工具、总部员工需“必修”相关知识
宜家母公司英格卡集团近日声称将进行“人工智能转型”,要求宜家总部内 3500 余员工需“必修”AI 知识,同时还将拓展一系列 AI 业务。IT之家从新闻稿中获悉,宜家声称自家总部企业内 3000 名基层员工及 500 名主管都要接受各种 AI 训练,要求员工掌握基础 AI 常识,同时了解生成式 AI 工具的使用方法,宜家主管还要定期开会,研究“如何掌握 AI 趋势、设计商业战略”。而针对有数据科学、机器学习或大型语言模型领域硕博士学位的员工,宜家还推出了专项培训计划,以便发挥这些员工的 AI 相关能力。此外,宜家目
谷歌正测试全新 AI 功能,陪你练英语口语
如何提高英语口语呢?或许很多人都没有条件和外国人面对面互动,谷歌近日测试的“Speaking practice”功能有望缓解这个问题,增强学习者的口语能力。谷歌 Search Labs 目前已经在阿根廷、哥伦比亚、印度、印度尼西亚、墨西哥和委内瑞拉进行测试该功能,后续可能会扩展到全球更多国家和地区。根据网友 @howfxr 分享的截图,该功能通过生成式 AI 增强英语口语练习,并通过示例帮助学习者提高口语。IT之家附上图片如下:
从MarTech迈向MarAI,衔远科技MODI摹小仙AI营销大脑全球首发!
发展新质生产力的背景下,产业革新持续加速。4月25日,“智领营销 创见未来”2024衔远科技产品发布会在上海举办。上海市经济和信息化委员会副主任张宏韬,清华大学惠妍讲席教授、衔远科技创始人周伯文,以及VISA、伊利集团、京东云、一轻科技、波士顿咨询等企业和机构的代表出席。发布会上,衔远科技正式推出MODI摹小仙AI营销大脑(以下简称MODI),并宣布筹建上海“国际消费品牌AI创新中心”。助力企业解决营销难题MODI摹小仙AI营销大脑上线新消费浪潮下,市场迎来了越来越多的变化和可能性,消费者需求变得更加难以捕捉,这就
当「养老」遇上 AI 大模型
作者:赖文昕编辑:陈彩娴鲜少有人关注到这样一个现象:在大模型的发展初期,「研发」与「产品」往往来自同一个群体——程序员。 由于大模型技术的系统复杂,新一代大模型产品经理的数量稀少,程序员往往既是技术、又是产品。 因此,程序员对 AI 大模型「究竟能解决什么问题」、「如何解决某个问题」的思考,也就在一定程度上刻画了第一批大模型落地应用的模样。
马斯克xAI疯狂融资,两周内将揽60亿美元,估值飙至180亿
机器之能报道编辑:SiaxAI正以180亿美元的估值筹集60亿美元资金。红杉资本是投资者之一,新资金将帮助xAI开发其聊天机器人Grok。马斯克的 xAI 公司即将获得数十亿美元的额外资金,这将使其聊天机器人 Grok 更具竞争力。据 theinformation 消息,两位熟悉交易的人士透露,马斯克这家仅成立一年的公司正以 180 亿美元的估值筹集 60 亿美元资金,而且这个估值还不包括 60 亿美元的融资(也就是说,投后估值将达 240 亿美元——编辑注)。其中一位知情人士称,红杉资本( Sequoia Cap
辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用
编辑 | X尽管蛋白质结构预测取得了重大进展。但对于 80% 以上的蛋白质,迄今为止尚未发现小分子配体。识别大多数蛋白质的小分子配体仍具有挑战性。现在,奥地利科学院分子医学研究中心 CeMM 的研究人员与辉瑞公司合作,开发了一种方法来预测数百种小分子与数千种人类蛋白质的结合活性。这项大规模研究揭示了数以万计的配体-蛋白质相互作用,通过探索这些相互作用,从而可以开发化学工具和治疗方法。此外,在机器学习和人工智能的支持下,它可以「公正」地预测小分子如何与活体人类细胞中存在的所有蛋白质相互作用。相关研究以《Large-s
英国 CMA 关注科技巨头和新兴 AI 创企间合作,启动反竞争预审查
英国竞争与市场管理局 CMA 近日表示,其正在关注科技巨头和新兴 AI 创企间的合作,已开始向这些合作是否符合英国合并法规、是否会削弱英国 AI 市场竞争向第三方征求意见。具体来说,CMA 本次的意见征求针对微软和 Mistral AI 的合作、亚马逊和 Anthropic 的合作以及微软同 Inflection AI 的复杂关系:Mistral AI 在三月向微软出售了价值 1640 万美元(当前约 1.19 亿元人民币)的股份,其也成为继 openAI 后第二家在微软 Azure 云服务上提供商用大语言模型的公
颜水成挂帅,昆仑万维2050全球研究院联合NUS、NTU发布Vitron,奠定通用视觉多模态大模型终极形态
近日,由颜水成教授带队,昆仑万维2050全球研究院、新加坡国立大学、新加坡南洋理工大学团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。这是一款重磅的通用视觉多模态大模型,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个全面统一静态图像与动态视频内容的理解、生成、分割、编辑等任务的像素级通用视觉多模态大模型,为下一代通用视觉大模型的终极形态奠定了基础,也标志着大模型迈向通用人工智能(AGI)的又一大步。Vitron作为一个统一
为什么要做长文本、长图文、长语音的大模型?深度解读讯飞星火V3.5春季上新
讯飞的持续高投入,换来了大模型能力的迅速提升。4 月 26 日,科大讯飞发布讯飞星火大模型 V3.5 的功能上新,其中一个重点就是面向用户各种场景中高效获取信息需求,发布首个长文本、长图文、长语音的大模型,能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习,还能够结合各种行业场景知识给出专业、准确回答。效果到底如何?今年人形机器人发展火热,我们将一份长达 70 多页的人形机器人报告,丢给了讯飞星火。只见星火很快上传解析了文件,我们先让星火总结这份报告的重点信息,星火条理清晰的给出了答案。然后又让它给出报