零一万物对 Yi-34B 训练过程的说明
就零一万物的观察和分析,大模型社区在技术架构方面现在是一个处于接近往通用化逐步收拢的阶段,基本上国际主流大模型都是基于Transformer的架构,做attention,activation,normalization,positional embedding等部分的改动,LLaMA、Chinchilla、Gopher 等模型的架构和 GPT 架构大同小异,全球开源社区基于主流架构的模型变化非常之多,生态呈现欣欣向荣,国内已发布的开源模型也绝大多数采用渐成行业标准的 GPT/LLaMA 的架构。...
鼎茂科技完成亿元级B轮融资,浙大校友布局AIOps新赛道,
上海鼎茂信息技术有限公司(以下简称“鼎茂科技”)完成亿元级B轮融资,由张江科投、国泰君安证裕投资、久立投资联合投资,老股东涌铧投资和彬复资本跟投,跃为资本担任独家财务顾问。本轮资金主要用于研发的持续投入,市场拓展以及跨行业的业务布局。...
启新模具完成数亿元B轮融资
启新模具完成数亿元B轮融资,泓诺创投参与投资,本轮其他投资方包括美的创投、投控东海等,璞真资本担任财务顾问。...
继续领跑新能源数字化智造领域赛道,依柯力获近亿元B+轮融资
近日,新能源数字化智造领域服务商依柯力信息科技(上海)股份有限公司完成近亿元B+轮融资,本轮融资由交银华侨数字经济基金领投,华峰新兴产业基金、神骐资本、重庆明月湖基金跟投,由华峰资本担任长期独家财务顾问,助力依柯力在新能源数字化智造领域赛道上稳步向前。...