发布日期:2024-03-13 08:32 点击次数:109
清华系多模态大模子公司成都神秘顾客价格监测,又拿钱了!
生数科技,师出清华朱军团队,是国内最早布局多模态大模子的团队之一。
神秘顾客公司_赛优市场调研阛阓讯息传来,这家公司刚刚完成新一轮数亿元融资。本轮融资由启明创投领投,达泰成本、鸿福厚德、智谱AI、老推进BV百度风投和卓源亚洲不绝跟投。
生数方面的说法是,本轮融资将主要用于多模态基础大模子的迭代研发、独揽居品更动及阛阓拓展。
此前,生数仍是在文生图、文生3D模子、文生视频方面都有磋商着力对外释出。
2022年9月,生数科技首创成员就提议了基于Transformer的收集架构U-ViT,这与Sora和Stable Diffusion3背后选定的Diffusion Transformer架构DiT,在架构想路与实验旅途上全都一致。
对此,生数科技CEO唐家渝暗示:
咱们蓄积了好意思满高效的工程化教育,领有在大限制GPU集群上达成高效兼容、低成本的模子施行教育,举座上来讲,咱们追逐Sora细目比追逐GPT-4嘱托许多。
本年一定能达到Sora刻下版块的效果,很难说是三个月如故半年(笑),但这件事咱们的信心还詈骂常足的。
2022年已提议类DiT架构U-ViT
在扩散模子方面,生数科技团队是国内起先开启该标的磋商的团队,着力触及主干收集、高速推理算法、大限制施行等全栈时间标的。
2022年9月,生数首创成员提议了基于Transformer的收集架构U-ViT时,U-ViT就在千万至数亿参数目级范围内考据了极强的可扩张性(scaling up)。
这项使命在CVPR 2023发表,早于DiT。
2023年3月,团队又开源了公共首个基于Diffusion Transformer架构(U-ViT)的多模态扩散大模子UniDiffuser,在参数目和施行数据限制上与Stable Diffusion平直对王人。
从架构上来看,UniDiffuser比最近公开论文的Stable Diffusion3(选定DiT架构)朝上了一年。
此外,除了单向的文生图除外,Unidiffuser营救更通用的图文任务,梗概达成图生文、图文集会生成、图文改写等多种功能。
捏续进行Scale up
在调和化架构的想路下,生数科技捏续进行Scale up。
在图文模子的施行中,其模子参数目从最早开源版的1B不停扩张至3B、7B、10B及以上,使得模子在好意思学性、多元格调、语义清醒等方面达成快速踏实的晋升。
同期在此基础上,通过拓展空间维度和时候维度,迟缓达成3D生成和视频生成模子的施行。
依托底层U-ViT架构的更动尝试,抑遏2023年9月,生数科技推出了基于调和的多模态多任务框架的产业级通用基础大模子(闭源版),全链路自主施行、自主研发,在图像生成、3D生成、视频生成等多项任务中位居前哨。
刻下的着力是,神秘顾客方法生数的3D生成,仍是可达成高精度与最快10秒级的模子生成。
此外,生数团队还推出公共首个4D动画生成、可控3D场景剪辑等使命。
而视频生成方面,也已达成短视频的剪辑与生成智商,在画面好意思不雅度、连贯性方面达成了冲突。
近期将要点冲突长视频生成智商
在营业化落所在面,依托于MaaS(模子即管事)智商,生数科技在2B、2C端同期发力。
一方面以API的形势向B端机构平直提供模子智商,另一方面打造垂类独揽居品,按照订阅等形势收费。
同时,中央第十三号文件《关于加强和完善城乡社区治理的意见》特别指出要“着力补齐城乡社区治理短板”,凸显这些难题成为国家攻关课题的重要性。物业管理领域被纳入“短板”问题。
刻下公司已与多家游戏公司、个东说念主终局厂商、互联网平台等B端机构开展配合,盛开模子管事,提供AIGC个性化体验、定制化实质分娩等方面的智商。
客岁,面向艺术贪图、游戏制作、影视动画、酬酢文娱等创意界限,生数科技上线了两款器具居品:
视觉创意贪图平台PixWeaver
3D财富创建器具VoxCraft
而学术层面上,团队于ICML、NeurIPS、ICLR等东说念主工智能顶会发表相干论文近30篇,其中提议的免施行推理算法Analytic-DPM、DPM-Solver等冲突性着力,赢得ICLR凸起论文奖,并被OpenAI、苹果、Stability.ai等机构选定,并被DALL·E 2、Stable Diffusion等阵势选定。
那么,接下来的路是什么?
谈到对改日的谋略,生数科技永恒坚捏“原生多模态”标的。
一边,是对居品端捏续迭代;
另一边,则是在基础模子层面捏续优化,主若是晋升语义清醒、可控性、好意思不雅度方面的生奏效果。
其实,Sora出现前,生数里面主要聚焦于短视频,但刻下公司会干与更多资源在长视频上,架构、数据使用调优方面,团队仍是作念过不少探索,也踩过许多坑(许多刻下都仍是措置了)。
但OpenAI砸大钱捧出一个Sora,考据了这条路的正确性,也废除了团队的许多顾忌,“刻下的视频生成长度在4-5秒摆布,咱们近期将要点冲突长视频生成智商……尤其长视频画面的连贯性,咱们还在作念一系列攻克使命”。
— 完 —成都神秘顾客价格监测
Powered by 宁波市场问卷调查 @2013-2022 RSS地图 HTML地图
Copyright 站群系统 © 2013-2022 粤ICP备09006501号