商汤科技今日宣布公告,拟配售 B 类股份,总筹 20.08 亿港元(当前约 18.71 亿元人民币)。据《科创板日报》报导,商汤本次配售有多家战略投资人及头部海外基金入股,现有股东增持,募集资金将用于大模型研究及产品开发等。
报导称,商汤将于 7 月 5 日世界人工智能大会上宣布日日新 5.5 大模型。官方没有透露关于日日新 5.5 大模型的更多信息,而此前有国内媒体报导称,商汤日日新大模型“近期”将迎来重大进级。在长文本处理才智上,进级后的商汤大模型将最新支持 100 万字以上超长文本,同时最多一次支持 50 多个文件问题解析。
另外,商汤今年 4 月 23 日宣布了日日新 5.0 大模型。据IT之家此前报导,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码才智方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然说话处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及才智。
今年 5 月,商汤宣布将免费向粤语区用户推出粤语大模型 Web 版及 App 版,“磋商说话大模型粤语版”及“磋商多模态大模型粤语版”即日起向企业用户开放 API。
相关阅读:
《商汤推出粤语版磋商说话 / 多模态大模型,可深入理解粤语俚语、粤文化》
《商汤宣布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo》