Orca

ORCA：基于持续批处理的LLM推理性能优化技术详解
大语言模型(LLMs)推理过程中的批处理优化面临显著挑战，这主要源于其推理过程的迭代特性。核心问题在于批处理中的各个请求完成时间存在差异，这导致资源释放和新请求整合的复杂性显著提高，特别是在处理不同完成阶段的请求时。当批处理中序列的生成长度差异较大时，GPU资源利用率往往不够理想。
理论
- 977
- 0
佚名12月9日
Cyan青心意创震撼发布“全面拟人”机器人OrcaⅠ，机器人开始懂情感、有温度
10月30日，Cyan青心意创（原“青心创新/萨恩异创”）正式发布了独立自研的通用人形机器人OrcaⅠ的动态视频，展示了其在“拟人直膝”状态下的行走、爬坡、原地转圈、行走/站立状态下的步态恢复、户外路面行走等运动控制能力，大语言模型加持下兼具情绪表达的自然语言交互能力，以及在保证精准控制状态下丝滑流畅的双臂操作能力。相较于市面上常见的“机械感”过重的机器人设计，OrcaⅠ摆脱了传统观念中人们对于…
应用
- 20
- 0
新闻助手10月30日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部